[go: up one dir, main page]

JP2008181299A - COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE - Google Patents

COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE Download PDF

Info

Publication number
JP2008181299A
JP2008181299A JP2007013864A JP2007013864A JP2008181299A JP 2008181299 A JP2008181299 A JP 2008181299A JP 2007013864 A JP2007013864 A JP 2007013864A JP 2007013864 A JP2007013864 A JP 2007013864A JP 2008181299 A JP2008181299 A JP 2008181299A
Authority
JP
Japan
Prior art keywords
control message
communication
information
log
control
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2007013864A
Other languages
Japanese (ja)
Other versions
JP4257364B2 (en
Inventor
Koyo Watanabe
幸洋 渡辺
Hiroyuki Yamashima
弘之 山島
Tetsuya Okano
哲也 岡野
Kenji Morimoto
健司 森本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2007013864A priority Critical patent/JP4257364B2/en
Priority to US12/017,864 priority patent/US7739420B2/en
Publication of JP2008181299A publication Critical patent/JP2008181299A/en
Application granted granted Critical
Publication of JP4257364B2 publication Critical patent/JP4257364B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/079Root cause analysis, i.e. error or fault diagnosis
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • G06F11/0709Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment in a distributed system consisting of a plurality of standalone computer nodes, e.g. clusters, client-server systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Computer Hardware Design (AREA)
  • Debugging And Monitoring (AREA)
  • Computer And Data Communications (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】管理モジュールを改造することなく、通信エラーが発生した原因を効率良く特定する。
【解決手段】通信データ取得部1401〜1403が、管理モジュール1201〜1203によって出力された実行ログ1211〜1223を取得し、実行制御モジュール130から管理モジュール1201〜1203宛てに送信される指示メッセージの識別情報に対応付けて管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされる制御メッセージの識別情報を記憶した通信パターンを通信パターンリポジトリ1411〜1413から読み出し、読み出した通信パターンと、取得した通信ログとに基づいて、送信されなかった制御メッセージを特定し、特定した制御メッセージに係る情報をログ解析結果1431〜1433に出力する。
【選択図】 図1
A method for efficiently identifying a cause of a communication error without modifying a management module.
A communication data obtaining unit 140 1 to 140 3, the management module 120 1-120 3 acquires the execution log 121 1 to 122 3 output by the management module 120 1-120 3 addressed from the execution control module 130 The communication pattern repository stores the communication pattern storing the identification information of the control message exchanged between the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 in association with the identification information of the instruction message transmitted to 141 1 to 141 3 , the control message that has not been transmitted is specified based on the read communication pattern and the acquired communication log, and information related to the specified control message is stored in the log analysis results 143 1 to 143 3 . Output.
[Selection] Figure 1

Description

この発明は、第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報を出力する通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置に関し、特に、第二の装置を改造することなく、通信エラーが発生した原因を効率良く特定することができる通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置に関するものである。   In the information processing system in which the first device controls the third device via the second device, the first device communicates between the first device and the second device, or the second device. Relating to a communication error information output program, a communication error information output method, and a communication error information output device that output information related to a communication error that has occurred in communication performed with a third device, in particular, remodeling the second device The present invention relates to a communication error information output program, a communication error information output method, and a communication error information output device that can efficiently identify the cause of the occurrence of a communication error.

従来、ITシステムの運用管理にともなう作業は、SE(System Engineer)やオペレータなど、人による作業を中心に行われてきた。しかし、近年では、ITシステムは大規模化および複雑化が進んでおり、人手による運用管理には限界が生じてきている。そこで、この問題を解決するための方法として、「自律運用」と呼ばれる方法が提案されている。   Conventionally, work associated with IT system operation management has been performed mainly by humans such as SE (System Engineer) and operators. In recent years, however, IT systems have become larger and more complex, and there has been a limit to manual operation management. Therefore, a method called “autonomous operation” has been proposed as a method for solving this problem.

図14は、従来のITシステムにおける自律運用を説明するための図である。同図に示すように、自律運用を行う場合には、ITシステムを構成するリソース10を管理する管理モジュール20と、管理モジュール20を制御する実行制御モジュール30とが用いられる。   FIG. 14 is a diagram for explaining autonomous operation in a conventional IT system. As shown in the figure, in the case of performing autonomous operation, a management module 20 that manages the resources 10 constituting the IT system and an execution control module 30 that controls the management module 20 are used.

管理モジュール20は、リソース10に対して各種の制御メッセージを送信することによって、情報を取得したり、設定を変更したりする。実行制御モジュール30は、運用管理の手順を定義した運用管理手順1に基づいて、管理モジュール20との間で各種の制御メッセージを送信することによって、複数の管理モジュール20を連係させて動作させる。なお、以下では、管理モジュール20が送信する制御メッセージを「指示メッセージ」と呼ぶ。   The management module 20 acquires information or changes settings by sending various control messages to the resource 10. The execution control module 30 operates the plurality of management modules 20 in association with each other by transmitting various control messages to the management module 20 based on the operation management procedure 1 that defines the operation management procedure. Hereinafter, the control message transmitted by the management module 20 is referred to as an “instruction message”.

かかる自律運用では、管理モジュール20は、実行制御モジュール30から送信された指示メッセージに基づいて自律的に処理を行って、処理結果を実行制御モジュール30に対して応答する。そのため、実行制御モジュール30からは、管理モジュール20の動作を詳細に確認することができず、この点が自律運用の課題となっている。以下、この課題について例をあげて説明する。   In such autonomous operation, the management module 20 autonomously performs processing based on the instruction message transmitted from the execution control module 30 and returns a processing result to the execution control module 30. For this reason, the execution control module 30 cannot confirm the operation of the management module 20 in detail, and this is a subject of autonomous operation. Hereinafter, this problem will be described with an example.

図15は、従来のITシステムにおける自律運用の課題を説明するための図である。同図に示すように、例えば、実行制御モジュール30が、運用管理手順1によって定義されたひとつの手順に基づいて、管理モジュール20に対して指示メッセージCM1を送信したとする(同図の(1)参照)。   FIG. 15 is a diagram for explaining a problem of autonomous operation in a conventional IT system. As shown in the figure, for example, it is assumed that the execution control module 30 transmits an instruction message CM1 to the management module 20 based on one procedure defined by the operation management procedure 1 ((1 in the same figure). )reference).

管理モジュール20は、指示メッセージCM1を受信すると、その内容に基づいて、リソース10との間でパケットを送受信するなどの所定の処理を行い(同図の(2)参照)、正常に処理を完了した場合には、実行制御モジュール30に対して応答メッセージRM1を送信する(同図の(3)参照)。   Upon receiving the instruction message CM1, the management module 20 performs a predetermined process such as transmitting / receiving a packet to / from the resource 10 based on the content of the instruction message CM1 (see (2) in the figure), and completes the process normally. If so, a response message RM1 is transmitted to the execution control module 30 (see (3) in the figure).

一方、実行制御モジュール30が、管理モジュール20に対して指示メッセージCM2を送信したとし(同図の(4)参照)、その指示メッセージCM2に対して、管理モジュール20から応答メッセージRM2が送信されなかったとする。   On the other hand, if the execution control module 30 transmits the instruction message CM2 to the management module 20 (see (4) in the figure), the response message RM2 is not transmitted from the management module 20 to the instruction message CM2. Suppose.

この場合、応答メッセージRM2が送信されなかった原因としては、
(a)実行制御モジュール30から送信された制御メッセージCM2が管理モジュール
20に届かなかった(同図の(5)参照)
(b)管理モジュール20とリソース10との間で行われる制御メッセージのやり取り
が正常に完了しなかった(同図の(6)参照)
(c)管理モジュール20からは応答メッセージRM2が送信されたが、何らかの理由
で、応答メッセージRM2が実行制御モジュール30に届かなかった(同図の(
7)参照)
などが考えられる。
In this case, the reason why the response message RM2 is not transmitted is as follows.
(A) The control message CM2 transmitted from the execution control module 30 did not reach the management module 20 (see (5) in the figure)
(B) Control message exchange between the management module 20 and the resource 10 was not completed normally (see (6) in the figure)
(C) Although the response message RM2 was transmitted from the management module 20, the response message RM2 did not reach the execution control module 30 for some reason ((
7) Reference)
And so on.

しかし、実行制御モジュール30からは、実行制御モジュール30と管理モジュール20との間、または、管理モジュール20とリソース10との間の、いずれに通信エラーの原因があるかを特定することはできない。   However, the execution control module 30 cannot identify the cause of the communication error between the execution control module 30 and the management module 20 or between the management module 20 and the resource 10.

この課題の解決策として、一般的には、実行制御モジュール30またはリソース10との間で行われる制御メッセージのやり取りについて、その状況や異常の発生などを実行制御モジュール30に対して通知するように、管理モジュール20の改造を行う。   As a solution to this problem, in general, the execution control module 30 is notified of the status and occurrence of an abnormality in the exchange of control messages performed with the execution control module 30 or the resource 10. The management module 20 is modified.

例えば、特許文献1では、ふたつの通信装置の間に接続された中継装置において、一方の通信装置から他方の通信装置に対して送信される制御信号を受信した場合に、送信先の通信装置の状況に応じて、送信元の通信装置から送信された制御信号の転送を制御する技術が開示されている。   For example, in Patent Document 1, in a relay device connected between two communication devices, when a control signal transmitted from one communication device to the other communication device is received, the communication device of the transmission destination A technique for controlling transfer of a control signal transmitted from a communication device that is a transmission source according to a situation is disclosed.

特開平5−30150号公報JP-A-5-30150

しかしながら、上述した従来の解決策では、管理モジュールに対して改造を加える必要があり、運用の実情を考えた場合には、開発リソースの制約や、過去のデータに対する後方置換性を確保できないなどの問題が生じる。そこで、運用の現場では、既存の管理モジュールを改造せずに自律運用を行うことが求められている。   However, in the conventional solution described above, it is necessary to modify the management module, and when considering the actual situation of operation, such as restrictions on development resources and backward replacement for past data cannot be secured. Problems arise. Therefore, in the field of operation, it is required to perform autonomous operation without modifying the existing management module.

しかし、本来、実行制御モジュールと管理モジュールとは、互いに連携することを前提に開発されていない場合が多く、実行モジュールから管理モジュールに対して送信される指示メッセージと、管理モジュールとリソースとの間でやり取りされる制御メッセージおよび応答メッセージとを対応付けることは困難になっている。   However, in many cases, the execution control module and the management module are not originally developed on the premise that they cooperate with each other. It is difficult to associate a control message and a response message exchanged with each other.

例えば、管理モジュールは、通常、実行モジュールやリソースとの間で行った通信の結果を記録した実行ログを出力するが、複数のセッションによって通信が行われる場合には、実行ログには多数の通信結果が混在して出力されるため、かかる実行ログを解析して、指示メッセージと、制御メッセージおよび応答メッセージとを対応付けることは非常に困難である。   For example, the management module normally outputs an execution log that records the results of communication performed with an execution module or resource, but when communication is performed by multiple sessions, the execution log contains a number of communications. Since the results are mixedly output, it is very difficult to analyze the execution log and associate the instruction message with the control message and the response message.

そのため、障害などによってネットワークに異常が発生して、実行制御モジュールから送信された指示メッセージに対して管理モジュールから応答メッセージが送信されなかった場合には、当該指示メッセージに基づいて管理モジュールがやり取りした制御メッセージを速やかに判別することができず、通信エラーが発生した原因を特定するまでに多大な時間が必要になるという問題がある。   Therefore, when an error occurs in the network due to a failure or the like and a response message is not sent from the management module to the instruction message sent from the execution control module, the management module exchanges based on the instruction message. There is a problem in that it is impossible to quickly determine the control message, and it takes a lot of time to identify the cause of the communication error.

したがって、管理モジュールを改造することなく、いかにして、通信エラーが発生した原因を効率良く特定するかが極めて重要な課題となっている。   Therefore, how to efficiently identify the cause of the communication error without modifying the management module is an extremely important issue.

この発明は、上述した従来技術による課題を解決するためになされたものであり、管理モジュールを改造することなく、通信エラーが発生した原因を効率良く特定することができる通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置を提供することを目的とする。   The present invention has been made to solve the above-described problems of the prior art, and a communication error information output program and communication that can efficiently identify the cause of a communication error without modifying the management module. An object of the present invention is to provide an error information output method and a communication error information output device.

上述した課題を解決し、目的を達成するため、本発明は、第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータに実行させる通信エラー情報出力プログラムであって、前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手順と、前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手順と、前記未送信制御メッセージ特定手順により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手順と、をコンピュータに実行させることを特徴とする。   In order to solve the above-described problems and achieve the object, the present invention provides an information processing system in which a first device controls a third device via a second device, the first device and the second device. A communication error information output program for causing a computer to execute an output process of information relating to a communication error that has occurred in communication performed between the second apparatus and the third apparatus, A communication log for acquiring a communication log in which a communication message exchanged between the second device and the third device in response to a control message transmitted from the first device to the second device is recorded. Identification information of the control message exchanged between the second device and the third device in association with the acquisition procedure and the identification information of the control message transmitted from the first device to the second device The system that remembered The message correspondence information is read, based on the read control message correspondence information and the communication log acquired by the communication log acquisition procedure, an unsent control message specifying procedure for specifying an unsent control message that has not been transmitted, A control message information output procedure for outputting information related to an untransmitted control message specified by an untransmitted control message specifying procedure is executed by a computer.

また、本発明は、上記の発明において、前記通信ログ取得手順は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、前記未送信制御メッセージ特定手順は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする。   Further, in the present invention according to the above invention, the communication log acquisition procedure may be performed by the plurality of second devices when the first device transmits a control message to each of the plurality of second devices. The communication log is collected, and the unsent control message specifying procedure has an effect on the unsent control message based on the influence information storing the information on the influence of the transmission of the control message on the transmission of other control messages. It is characterized by specifying an applied control message.

また、本発明は、上記の発明において、前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、前記未送信制御メッセージ特定手順は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする。   Further, the present invention is the above invention, wherein the control message correspondence information is associated with identification information of a control message transmitted from the first device to the second device, and the second device and the third device. Storing identification information of the control message exchanged with the device and identification information of the third device, the untransmitted control message specifying procedure reads the control message correspondence information, and the read control message correspondence information; Based on the communication log acquired by the communication log acquisition procedure, the untransmitted control message that has not been transmitted and the second device or the third device that could not transmit the control message are specified.

また、本発明は、第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータが実行する通信エラー情報出力方法であって、前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得工程と、前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得工程により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定工程と、前記未送信制御メッセージ特定工程により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力工程と、を含んだことを特徴とする。   In the information processing system in which the first device controls the third device via the second device, the present invention provides communication performed between the first device and the second device or the second device. A communication error information output method in which a computer executes output processing of information related to a communication error that has occurred in communication performed between a device and a third device, from the first device to the second device A communication log acquisition step for acquiring a communication log in which a communication message exchanged between the second device and the third device is recorded in response to the control message transmitted in the first step; Read and read control message correspondence information storing control message identification information exchanged between the second device and the third device in association with control message identification information transmitted to the second device System Based on message correspondence information and the communication log acquired by the communication log acquisition step, an unsent control message specifying step for specifying an unsent control message that has not been transmitted, and an unsent control message specifying step are specified. And a control message information output step for outputting information related to the untransmitted control message.

また、本発明は、上記の発明において、前記通信ログ取得工程は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、前記未送信制御メッセージ特定工程は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする。   Also, in the present invention according to the above invention, the communication log acquisition step includes the steps of the plurality of second devices when the first device transmits a control message to each of the plurality of second devices. The communication log is collected, and the untransmitted control message specifying step has an influence on the untransmitted control message based on the influence information storing information on the influence of the transmission of the control message on the transmission of other control messages. It is characterized by specifying an applied control message.

また、本発明は、上記の発明において、前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、前記未送信制御メッセージ特定工程は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得工程により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする。   Further, the present invention is the above invention, wherein the control message correspondence information is associated with identification information of a control message transmitted from the first device to the second device, and the second device and the third device. Storing control message identification information and third device identification information exchanged with the device, the untransmitted control message specifying step reads the control message correspondence information, and the read control message correspondence information; Based on the communication log acquired by the communication log acquisition step, the second device or the third device that could not transmit the untransmitted control message and the control message that were not transmitted are specified.

また、本発明は、第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報を出力する通信エラー情報出力装置であって、前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手段と、前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手段により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手段と、前記未送信制御メッセージ特定手段により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手段と、を備えたことを特徴とする。   In the information processing system in which the first device controls the third device via the second device, the present invention provides communication performed between the first device and the second device or the second device. A communication error information output device that outputs information related to a communication error that has occurred in communication performed between a device and a third device, the control transmitted from the first device to the second device A communication log acquisition means for acquiring a communication log in which a communication message exchanged between the second device and the third device in response to the message is recorded, and from the first device to the second device Read out the control message correspondence information storing the identification information of the control message exchanged between the second device and the third device in association with the identification information of the transmitted control message, and read out the control message correspondence information When, Based on the communication log acquired by the communication log acquisition means, an untransmitted control message specifying means for specifying an untransmitted control message that has not been transmitted, and an untransmitted control message specified by the untransmitted control message specifying means And control message information output means for outputting information related to the above.

また、本発明は、上記の発明において、前記通信ログ取得手段は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、前記未送信制御メッセージ特定手段は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする。   Further, the present invention is the above invention, wherein the communication log acquisition means is configured such that when the first device transmits a control message to each of the plurality of second devices, the plurality of second devices The communication log is collected, and the untransmitted control message specifying means has an influence on the untransmitted control message based on the influence information storing information on the influence of the transmission of the control message on the transmission of other control messages. It is characterized by specifying an applied control message.

また、本発明は、上記の発明において、前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、前記未送信制御メッセージ特定手段は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手段により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする。   Further, the present invention is the above invention, wherein the control message correspondence information is associated with identification information of a control message transmitted from the first device to the second device, and the second device and the third device. Storing identification information of the control message exchanged with the device and identification information of the third device, the untransmitted control message specifying means reads the control message correspondence information, and the read control message correspondence information; Based on the communication log acquired by the communication log acquisition means, an untransmitted control message that has not been transmitted and a second device or a third device that has failed to transmit the control message are identified.

本発明によれば、第一の装置から第二の装置に対して送信された制御メッセージに応じて第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得し、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、取得した通信ログとに基づいて、送信されなかった未送信制御メッセージを特定し、特定した未送信制御メッセージに係る情報を出力するので、第一の装置から第二の装置宛てに送信された制御メッセージと、第二の装置と第三の装置との間でやり取りされた制御メッセージとを容易に対応付けることが可能になり、第二の装置を改造することなく、通信エラーが発生した原因を効率良く特定することができるという効果を奏する。   According to the present invention, a communication log in which a communication message exchanged between a second device and a third device in response to a control message transmitted from the first device to the second device is recorded. And stores the identification information of the control message exchanged between the second device and the third device in association with the identification information of the control message transmitted from the first device to the second device. Control message correspondence information is read, based on the read control message correspondence information and the acquired communication log, an unsent control message that has not been transmitted is identified, and information related to the identified unsent control message is output. The control message transmitted from the first device to the second device can be easily associated with the control message exchanged between the second device and the third device. The result, without modifying the second device, an effect that the cause of the communication error occurs can be efficiently identified.

また、本発明によれば、第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、複数の第二の装置から通信ログを収集し、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定するので、ある制御メッセージの送信において通信エラーが発生した場合に、その制御メッセージの送信に影響を及ぼした他の制御メッセージを特定することが可能になり、通信エラーが発生した根本的な原因を特定することができるという効果を奏する。   Further, according to the present invention, when the first device transmits a control message to each of the plurality of second devices, the communication log is collected from the plurality of second devices, and the transmission of the control message is performed separately. When a communication error occurs in the transmission of a certain control message, the control message that has influenced the unsent control message is identified based on the influence information that stores the information on the influence on the transmission of the control message. In addition, it is possible to specify another control message that has affected the transmission of the control message, and it is possible to specify the root cause of the occurrence of a communication error.

また、本発明によれば、制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、かかる制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定するので、通信エラーが発生した原因となる装置を特定することができるという効果を奏する。   According to the present invention, the control message correspondence information is associated with the identification information of the control message transmitted from the first device to the second device, between the second device and the third device. The identification information of the exchanged control message and the identification information of the third device are stored, the control message correspondence information is read, and the untransmitted control that has not been transmitted based on the read control message correspondence information and the communication log Since the second device or the third device that has failed to transmit the message and the control message is specified, it is possible to specify the device that causes the communication error.

以下に添付図面を参照して、この発明に係る通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置の好適な実施例を詳細に説明する。なお、本実施例では、自律運用によりITシステムのリソースを制御するITリソース制御装置に本発明を適用した場合を説明する。   Exemplary embodiments of a communication error information output program, a communication error information output method, and a communication error information output device according to the present invention will be described below in detail with reference to the accompanying drawings. In this embodiment, a case will be described in which the present invention is applied to an IT resource control apparatus that controls IT system resources by autonomous operation.

まず、本実施例1に係るITリソース制御装置の概要および構成について説明する。図1は、本実施例1に係るITリソース制御装置の概要および構成を説明するための図である。同図に示すように、このITリソース制御装置100は、自律運用により制御対象リソース1101〜1103を制御する装置であり、管理モジュール1201〜1203と、実行制御モジュール130と、通信データ取得部1401〜1403とを有する。 First, the outline and configuration of the IT resource control apparatus according to the first embodiment will be described. FIG. 1 is a diagram for explaining the outline and configuration of the IT resource control apparatus according to the first embodiment. As shown in the figure, the IT resource control device 100 is a device that controls the control target resources 110 1 to 110 3 by autonomous operation, and includes management modules 120 1 to 120 3 , an execution control module 130, and communication data. Acquisition units 140 1 to 140 3 .

本実施例1に係るITリソース制御装置100では、管理モジュール1201〜1203および実行制御モジュール130は、それぞれ、図14に示した管理モジュール20および実行制御モジュール30と同じ機能を有するものであるが、通信データ取得部1401〜1403とを有する点が、図14に示したITシステムとは異なっている。以下、ITリソース制御装置100が有する各機能部について説明する。 In the IT resource control apparatus 100 according to the first embodiment, the management modules 120 1 to 120 3 and the execution control module 130 have the same functions as the management module 20 and the execution control module 30 shown in FIG. 14, respectively. However, it differs from the IT system shown in FIG. 14 in that it has communication data acquisition units 140 1 to 140 3 . Hereinafter, each functional unit included in the IT resource control apparatus 100 will be described.

管理モジュール1201〜1203は、制御対象リソース1101〜1103に対して各種の制御メッセージを送信することによって、情報の取得や、設定の変更などを行なう処理部である。また、管理モジュール1201〜1203は、それぞれ、実行制御モジュール130または制御対象リソース1101〜1103との間で通信を行うと、その通信でやり取りした通信データを記録した実行ログ1211〜1213を出力する。 The management modules 120 1 to 120 3 are processing units that acquire information, change settings, and the like by transmitting various control messages to the control target resources 110 1 to 110 3 . Further, when the management modules 120 1 to 120 3 communicate with the execution control module 130 or the control target resources 110 1 to 110 3 , respectively, the execution logs 121 1 to 121 1 record the communication data exchanged by the communication. 121 3 is output.

図2は、本実施例1に係る管理モジュール1201〜1203により出力される実行ログ1211〜1213の一例を示す図である。同図(a)および(b)に示す実行ログは、それぞれ、異なる管理モジュールによって出力された実行ログを示している。 Figure 2 is a diagram showing an example of the execution log 121 1 to 121 3 output by the management module 120 1-120 3 according to the first embodiment. The execution logs shown in FIGS. 9A and 9B are execution logs output by different management modules.

同図に示すように、例えば、実行ログは、通信データごとのシーケンス番号を示す「No.c」と、通信データが送信された時刻を示す「時刻」と、通信データを送信したセッションを識別する「セッションID」と、通信データの送信元である装置を示す「送信元」と、通信データの送信先である装置を示す「宛先」と、通信データの送信に用いられたプロトコルを示す「プロトコル」と、通信データの種類を示す「制御内容」と、通信データに設定されたパラメータ値を示す「パラメータ」とから構成される。   As shown in the figure, for example, the execution log identifies “No. c” indicating the sequence number for each communication data, “time” indicating the time when the communication data is transmitted, and the session that transmitted the communication data. "Session ID", "transmission source" indicating a device that is a transmission source of communication data, "destination" indicating a device that is a transmission destination of communication data, and "protocol" used for transmission of communication data It consists of “protocol”, “control content” indicating the type of communication data, and “parameter” indicating the parameter value set in the communication data.

ここで、同図(a)に示す実行ログは、管理モジュールAによって出力されたものであり、この実行ログには、実行制御モジュール130から管理モジュールAに対して送信された指示メッセージ(No.c=1の通信データ)と、その指示メッセージに基づいて管理モジュールAと制御対象リソースとの間で双方向にやり取りされた制御メッセージ(No.c=2〜7の通信データ)と、管理モジュールAから実行制御モジュール130に対して送信された失敗メッセージ(指示メッセージに対する処理が正常に行われなかったことを示す応答メッセージ)(No.c=8の通信データ)とがそれぞれ記録されている。   Here, the execution log shown in FIG. 5A is output by the management module A. The execution log includes an instruction message (No. 1) transmitted from the execution control module 130 to the management module A. c = 1 communication data), a control message (No. c = 2-7 communication data) exchanged between the management module A and the control target resource based on the instruction message, and the management module A failure message transmitted from A to the execution control module 130 (response message indicating that processing for the instruction message has not been performed normally) (communication data of No. c = 8) is recorded.

一方、同図(b)に示す実行ログは、管理モジュールBによって出力されたものであり、この実行ログには、実行制御モジュール130から管理モジュールBに対して送信された指示メッセージ(No.c=1の通信データ)と、その指示メッセージに基づいて管理モジュールBと制御対象リソースとの間で双方向にやり取りされた制御メッセージ(No.c=2〜8の通信データ)と、管理モジュールBから実行制御モジュール130に対して送信された成功メッセージ(指示メッセージに対する処理が正常に行われたことを示す応答メッセージ;No.c=9の通信データ)とがそれぞれ記録されている。   On the other hand, the execution log shown in FIG. 7B is output by the management module B, and the execution log includes an instruction message (No. c) transmitted from the execution control module 130 to the management module B. = 1), a control message (communication data of No. c = 2 to 8) exchanged bidirectionally between the management module B and the control target resource based on the instruction message, and the management module B And a success message (response message indicating that the processing for the instruction message has been normally performed; communication data of No. c = 9) transmitted to the execution control module 130 is recorded.

なお、同図(a)および(b)に示す実行ログは、それぞれ、セッションIDが「SS1」および「SS2」であるセッションのみを示しているが、実行ログ1211〜1213には、複数のセッションによって行われた通信に係る通信データが混在して記録される。 In addition, although the execution log shown to the same figure (a) and (b) has shown only the session whose session ID is "SS1" and "SS2", respectively, the execution log 121 1 -121 3 contains two or more. The communication data related to the communication performed by the session is recorded together.

図1に戻って、実行制御モジュール130は、運用管理の手順を定義した運用管理手順1に基づいて、管理モジュール1201〜1203との間で各種の制御メッセージを送信することによって、複数の管理モジュール1201〜1203を連係させて動作させる処理部である。 Returning to FIG. 1, the execution control module 130 transmits various control messages to and from the management modules 120 1 to 120 3 based on the operation management procedure 1 that defines the operation management procedure. This is a processing unit that operates the management modules 120 1 to 120 3 in cooperation with each other.

通信データ取得部1401〜1403は、管理モジュール1201によって出力された実行ログ1211に基づいて、実行制御モジュール130と管理モジュール1201〜1203との間で行われる通信、または、管理モジュール1201〜1203と制御対象リソース1101〜1103との間で行われる通信に発生した通信エラーの原因に係る情報を出力する処理部である。なお、これら通信データ取得部1401〜1403は、いずれも同様の構成を有するので、ここでは通信データ取得部1401を例にあげて説明する。 Communication data obtaining unit 140 1 to 140 3, based on the management module 120 1 execution log 121 1 output by the communication performed between the execution control module 130 and the management module 120 1-120 3, or manage It is a processing unit that outputs information relating to the cause of a communication error that has occurred in communication performed between the modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 . Note that the communication data acquisition units 140 1 to 140 3 all have the same configuration, and therefore the communication data acquisition unit 140 1 will be described as an example here.

通信データ取得部1401は、同図に示すように、通信パターンリポジトリ1411と、ログ解析部1421とを有する(通信データ取得部1402は、通信パターンリポジトリ1412と、ログ解析部1422とを、通信データ取得部1403は、通信パターンリポジトリ1413と、ログ解析部1423とを、それぞれ有する)。以下、通信データ取得部1401が有する各機能部について説明する。 As shown in the figure, the communication data acquisition unit 140 1 includes a communication pattern repository 141 1 and a log analysis unit 142 1 (the communication data acquisition unit 140 2 includes a communication pattern repository 141 2 and a log analysis unit 142. 2 , the communication data acquisition unit 140 3 includes a communication pattern repository 141 3 and a log analysis unit 142 3 ). The following describes each functional unit communication data acquiring unit 140 1 has.

通信パターンリポジトリ1411は、実行制御モジュール130から管理モジュール1201に対して送信される指示メッセージと、その制御メッセージに基づいて管理モジュール1201と制御対象リソース1101との間でやり取りされる制御メッセージの組とを対応付けた通信パターンを、指示メッセージごとに記憶する記憶部である。 Communication pattern repository 141 1, an instruction message transmitted from the execution control module 130 to the management module 120 1, the control exchanged between the management module 120 1 based on the control messages and the control target resources 110 1 It is a memory | storage part which memorize | stores the communication pattern which matched the group of messages for every instruction | indication message.

図3は、本実施例1に係る通信パターンリポジトリ1411の一例を示す図である。同図に示すように、通信パターンリポジトリ1411は、具体的には、「送信元」、「宛先」、「プロトコル」、「制御内容」、「パラメータ」を、実行ログ1211に記録される通信データの項目に対応するように記憶する。同図(a)および(b)に示す通信パターンリポジトリは、それぞれ、図2に示した実行ログを出力する管理モジュールAおよび管理モジュールBの通信パターンリポジトリを示している。 FIG. 3 is a diagram illustrating an example of the communication pattern repository 141 1 according to the first embodiment. As shown in the figure, the communication pattern repository 141 1 specifically records “transmission source”, “destination”, “protocol”, “control content”, and “parameter” in the execution log 121 1. It memorize | stores corresponding to the item of communication data. The communication pattern repositories shown in FIGS. 2A and 2B show the communication pattern repositories of the management module A and the management module B that output the execution log shown in FIG.

このように、通信パターンリポジトリ1411は、実行制御モジュール130から送信された指示メッセージに基づいて行われる処理が、全て正常に行われた場合に、その結果として管理モジュール1201と制御対象リソース1101との間でやり取りされる全ての制御メッセージの組を、当該指示メッセージに対応付けて記憶するものである。 As described above, when all the processes performed based on the instruction message transmitted from the execution control module 130 are normally performed, the communication pattern repository 141 1 results in the management module 120 1 and the control target resource 110 being processed. A set of all control messages exchanged with 1 is stored in association with the instruction message.

ログ解析部1421は、管理モジュール1201によって出力された実行ログ1211および通信パターンリポジトリ1411に基づいて、通信エラーの原因を特定し、特定した通信エラーの原因に係る情報を含めたログ解析結果1431出力する処理部である。 The log analysis unit 142 1 identifies the cause of the communication error based on the execution log 121 1 and the communication pattern repository 141 1 output by the management module 120 1 , and includes a log including information relating to the identified cause of the communication error This is a processing unit that outputs the analysis result 143 1 .

具体的には、このログ解析部1421は、まず、実行制御モジュール130から管理モジュール1201に対して送信された指示メッセージに応じて管理モジュール1201と制御対象リソース1101との間でやり取りされた通信メッセージが記録された実行ログ1211を取得し、取得した実行ログ1211に記録されている通信データをセッションごとに分割する。 Specifically, the log analysis unit 142 1 first exchanges between the management module 120 1 and the control target resource 110 1 according to the instruction message transmitted from the execution control module 130 to the management module 120 1 . The execution log 121 1 in which the communication message is recorded is acquired, and the communication data recorded in the acquired execution log 121 1 is divided for each session.

続いて、ログ解析部1421は、セッションごとに分割された実行ログ1211を、通信パターンリポジトリ1411に記憶された通信パターンと比較することによって、実行制御モジュール130と管理モジュール1201〜1203との間で行われた通信、または、管理モジュール1201〜1203と制御対象リソース1101〜1103との間で行われた通信に異常が発生しているか否かを判定する。 Subsequently, the log analysis unit 142 1 compares the execution log 121 1 divided for each session with the communication pattern stored in the communication pattern repository 141 1 , thereby executing the execution control module 130 and the management modules 120 1 to 120. 3 , it is determined whether or not an abnormality has occurred in the communication performed with the communication module 3 or the communication performed between the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 .

ここで、異常が発生していると判定した場合には、ログ解析部1421は、異常の原因となった通信データ、すなわち、正常に送受信が行われなかった通信データを特定する。そして、ログ解析部1421は、特定した通信データに係る情報を含めたログ解析結果1431を生成して、出力する(ログ解析部1422は、ログ解析結果1432を、ログ解析部1423は、ログ解析結果1433を、それぞれ出力する)。 Here, if it is determined that the abnormality has occurred, the log analysis unit 142 1, communication data that caused the anomaly, i.e., identifies the communication data transmitted and received is not performed normally. Then, the log analysis unit 142 1 generates and outputs a log analysis result 143 1 including information related to the specified communication data (the log analysis unit 142 2 outputs the log analysis result 143 2 to the log analysis unit 142. 3 outputs the log analysis result 143 3 ).

次に、上記で説明したログ解析部1421の処理手順について、詳細に説明する。図4は、本実施例1に係るログ解析部1421の処理手順を示すフローチャートである。同図に示すように、ログ解析部1421は、まず、実行ログ1211を読み込み(ステップS101)、読み込んだ実行ログ1211をセッション単位で切り分け、セッションごとの実行ログとして内部メモリに記憶する(ステップS102)。 Next, the procedure for the log analysis unit 142 1 described above, will be described in detail. FIG. 4 is a flowchart illustrating the processing procedure of the log analysis unit 1421 according to the first embodiment. As shown in the figure, the log analysis unit 142 1 first reads the execution log 121 1 (step S101), divides the read execution log 121 1 by session, and stores it in the internal memory as an execution log for each session. (Step S102).

続いて、ログ解析部1421は、内部メモリに記憶したセッションごとの実行ログの中から、実行ログを1件読み出す(ステップS103)。ここで、ログ解析部1421は、読み出す実行ログが無かった場合には(ステップS104,No)、処理を終了する。 Subsequently, the log analysis unit 142 1, from the execution log for each session that is stored in the internal memory, reads one piece of execution log (step S103). Here, the log analysis unit 142 1, when read execution log was not (step S104, No), the process ends.

一方、読み出す実行ログがあった場合には(ステップS104,Yes)、ログ解析部1421は、当該実行ログの中から通信データを1行読み出す(ステップS105)。ここで、まだ実行ログの終端ではなかった場合には(ステップS106,No)、ログ解析部1421は、当該通信データに一致するメッセージを含んだ通信パターンを、通信パターンリポジトリ1411に記憶された通信パターンの中から探索する(ステップS107)。 On the other hand, if there is an execution log to read (step S104, Yes), the log analysis unit 142 1 reads one line communication data from the the execution log (step S105). If the end of the execution log has not yet been reached (No at step S106), the log analysis unit 142 1 stores a communication pattern including a message matching the communication data in the communication pattern repository 141 1. The communication pattern is searched for (step S107).

この時、ログ解析部1421は、当該通信データが実行ログの1行目の通信データであった場合には、上記のとおり、通信パターンリポジトリ1411に記憶されたメッセージの中から通信パターンを探索するが、2行目以降であった場合には、後述するステップS109で内部メモリに記憶される一致パターンの中から通信パターンを探索する。 At this time, if the communication data is communication data in the first line of the execution log, the log analysis unit 142 1 selects a communication pattern from the messages stored in the communication pattern repository 141 1 as described above. If the second and subsequent lines are searched, a communication pattern is searched for from the matching patterns stored in the internal memory in step S109 described later.

そして、当該通信データに一致するメッセージを含んだ通信パターンがあった場合には(ステップS108,Yes)、ログ解析部1421は、その通信パターンを一致パターンとして内部メモリに記憶する(ステップS109)。 Then, when there is a communication pattern including a message that matches the communication data (step S108, Yes), the log analysis unit 142 1 is stored in the internal memory the communication pattern as the matching pattern (step S109) .

ここで、ログ解析部1421は、一致パターンとして通信パターンを記憶する際に、その通信パターンに含まれるメッセージの1つ1つに対してフラグを付与し、さらに、実行ログから読み出した通信データと一致することを確認したメッセージについては、そのフラグをチェックしておく。 Here, when storing the communication pattern as the matching pattern, the log analysis unit 142 1 gives a flag to each message included in the communication pattern, and further reads the communication data read from the execution log. For a message that is confirmed to match, check its flag.

この後、ログ解析部1421は、ステップS105に戻って、実行ログから次の通信データを読み出し、上記の処理を繰り返す。 Thereafter, the log analysis unit 142 1 returns to step S105, reads the next communication data from the execution log, and repeats the above processing.

一方、当該通信データに一致するメッセージを含んだ通信パターンがなかった場合には(ステップS108,No)、ログ解析部1421は、当該通信データは異常を示すものであると判断し、通信エラーの原因を特定する原因箇所判定処理を行った後に(ステップS112)、セッションごとの判定結果を「異常」として出力する(ステップS113)。なお、この原因箇所特定処理については、後に詳細に説明する。 On the other hand, (step S108, No), the log analysis unit 142 1 when there is no communication pattern including a message that matches the communication data, determines that the communication data is indicative of abnormal communication error After the cause location determination process for identifying the cause of the error (step S112), the determination result for each session is output as “abnormal” (step S113). The cause location specifying process will be described later in detail.

ところで、ログ解析部1421は、実行ログの中から通信データを1行読み出す際に、実行ログの終端であることを検出した場合には、(ステップS106,Yes)、セッションごとに処理が正常に終了しているか否かを判定する正常/異常判定処理を行う(ステップS110)。なお、この正常/異常判定処理については、後に詳細に説明する。 By the way, when the log analysis unit 142 1 detects the end of the execution log when reading one line of communication data from the execution log (Yes in step S106), the process is normal for each session. A normal / abnormal determination process is performed to determine whether or not the process has ended (step S110). The normal / abnormal determination process will be described later in detail.

そして、正常/異常判定処理を行った結果、異常があったと判定された場合には(ステップS111,Yes)、ログ解析部1421は、原因箇所特定処理を行った後に(ステップS112)、セッションごとの判定結果を「異常」として出力する(ステップS113)。 Then, as a result of normal / abnormality determination process, if it is determined that an abnormality has occurred (step S 111, Yes), the log analysis unit 142 1, after the cause place specifying process (step S112), the session Each determination result is output as “abnormal” (step S113).

なお、正常/異常判定処理を行った結果、正常であったと判定された場合には(ステップS111,No)、ログ解析部1421は、原因箇所特定処理を行わずに、セッションごとの判定結果を「正常」として出力する(ステップS113)。 Incidentally, as a result of the normal / abnormal determination process, if it is determined that a normal (step S 111, No), the log analysis unit 142 1 without deducing the cause process, the determination result of each session Is output as “normal” (step S113).

次に、図4に示した正常/異常判定処理の処理手順について説明する。図5は、図4に示した正常/異常判定処理の処理手順を示すフローチャートである。同図に示すように、この正常/異常判定処理では、ログ解析部1421は、まず、内部メモリに記憶された一致パターンから通信パターンを1件読み込む(ステップS201)。 Next, the processing procedure of the normal / abnormal determination process shown in FIG. 4 will be described. FIG. 5 is a flowchart showing a processing procedure of normality / abnormality determination processing shown in FIG. As shown in the figure, in this normal / abnormal determination process, the log analysis unit 1421 first reads one communication pattern from the matching pattern stored in the internal memory (step S201).

ここで、一致パターンから通信パターンを読み込めた場合には(ステップS202,Yes)、ログ解析部1421は、その通信パターンに含まれる全てのメッセージのフラグがチェックされているか否かを確認し、全てのフラグがチェックされていなかった場合には(ステップS203,No)、当該通信パターンを未完了のパターンとして登録する(ステップS204)。 Here, the matching pattern in the case of load communication pattern (step S202, Yes), the log analysis unit 142 1 checks whether the flag of all the messages included in the communication pattern is checked, If all the flags have not been checked (No at Step S203), the communication pattern is registered as an incomplete pattern (Step S204).

一方、全てのフラグがチェックされていた場合には(ステップS203,Yes)、ログ解析部1421は、セッションの判定結果を「正常」とする(ステップS205)。 On the other hand, if all the flag is checked (step S203, Yes), the log analysis unit 142 1, the judgment result of the session is "normal" (step S205).

また、内部メモリに記憶された一致パターンから通信パターンを読み込む際に、通信パターンが読み込めなかった場合には(ステップS202,No)、ログ解析部1421は、その時点で登録されている未完了パターンを内部メモリに出力し(ステップS206)、セッションの判定結果を「異常」とする(ステップS207)。 Also, when reading communication pattern from the matching pattern stored in the internal memory, if the communication pattern is not read (step S202, No), the log analysis unit 142 1, complete non that are registered at that time The pattern is output to the internal memory (step S206), and the session determination result is “abnormal” (step S207).

次に、図4に示した原因箇所判定処理の処理手順について説明する。図6は、図4に示した原因箇所判定処理の処理手順を示すフローチャートである。同図に示すように、この原因箇所判定処理では、ログ解析部1421は、まず、内部メモリに記憶された未完了パターンおよびセッションごとの実行ログを読み込む(ステップS301)。 Next, the procedure of the cause location determination process shown in FIG. 4 will be described. FIG. 6 is a flowchart showing a processing procedure of the cause location determination process shown in FIG. As shown in the figure, in the cause location determination process, the log analysis unit 1421 first reads the incomplete pattern and the execution log for each session stored in the internal memory (step S301).

続いて、ログ解析部1421は、読み込んだ実行ログと未完了パターンとを比較し、実行ログにおいて、未完了パターンに含まれるメッセージと一致しない最初の通信データを抽出する(ステップS302)。ここで、例えば、実行ログが、図2(a)に示した実行ログであり、未完了パターンが、図3(a)に示した通信パターンであったとすると、ログ解析部1421は、これらを比較し、図2(a)の実行ログのNo.=7の通信データを抽出する。 Subsequently, the log analysis unit 142 1 compares the execution log and the incomplete pattern read in the execution log, and extracts the first communication data that does not match the message contained in incomplete pattern (step S302). Here, for example, if the execution log is the execution log shown in FIG. 2A and the incomplete pattern is the communication pattern shown in FIG. 3A, the log analysis unit 142 1 And the No. of the execution log in FIG. = 7 communication data is extracted.

そして、ログ解析部1421は、抽出した通信データから送信元を特定し(ステップS303)、その送信元に関する情報と、差分となった通信データを含めたログ解析結果1431を生成して出力する(ステップS304)。 Then, the log analysis unit 142 1 identifies a transmission source from the extracted communication data (step S303), and generates and outputs a log analysis result 143 1 including information regarding the transmission source and communication data that has become a difference. (Step S304).

上述してきたように、本実施例1では、通信データ取得部1401〜1403が、実行制御モジュール130から管理モジュール1201〜1203に対して送信された指示メッセージに応じて管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされた通信メッセージが記録された実行ログ1211〜1223を取得し、実行制御モジュール130から管理モジュール1201〜1203宛てに送信される指示メッセージの識別情報に対応付けて管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされる制御メッセージの識別情報を記憶した通信パターンを通信パターンリポジトリ1411〜1413から読み出し、読み出した通信パターンと、取得した通信ログとに基づいて、送信されなかった制御メッセージを特定し、特定した制御メッセージに係る情報をログ解析結果1431〜1433に出力するので、実行制御モジュール130から管理モジュール1201〜1203宛てに送信された指示メッセージと、管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされた制御メッセージとを容易に対応付けることが可能になり、管理モジュール1201〜1203を改造することなく、通信エラーが発生した原因を効率良く特定することができる。 As described above, in the first embodiment, the communication data acquisition units 140 1 to 140 3 are managed by the management module 120 1 according to the instruction message transmitted from the execution control module 130 to the management modules 120 1 to 120 3 . 120 3 and the control target resources 110 1 exchanges communication messages obtains the execution log 121 1 to 122 3 that is recorded with the 110 3, the management module 120 1 to 120 3 addressed from the execution control module 130 A communication pattern storing the identification information of the control message exchanged between the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 in association with the identification information of the instruction message to be transmitted is a communication pattern repository 141. 1-141 read from 3, and the read-out communication pattern, the communication log acquired Based on, identify the control message was not sent, transmits the information relating to the identified control messages because the log analysis result 143 1-143 3, the management module 120 1-120 3 addressed from the execution control module 130 an instruction message, the management module 120 1-120 3 and it is possible to easily associate the interaction control message between the control target resource 1101 3, the management module 120 1-120 3 The cause of the communication error can be identified efficiently without modification.

また、本実施例1では、通信パターンリポジトリ1411〜1413が、制御メッセージ対応情報は、実行制御モジュール130から管理モジュール1201〜1203宛てに送信される制御メッセージの識別情報に対応付けて管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされる制御メッセージの識別情報、管理モジュール1201〜1203および制御対象リソース1101〜1103の識別情報を通信パターンとして記憶し、ログ解析部1421〜1413が、かかる通信パターンを読み出し、読み出した通信パターンと、実行ログ1211〜1213とに基づいて、送信されなかった制御メッセージおよび制御メッセージを送信できなかった管理モジュール1201〜1203または制御対象リソース1101〜1103を特定するので、通信エラーが発生した原因となる装置を特定することができる。 In the first embodiment, the communication pattern repositories 141 1 to 141 3 associate the control message correspondence information with the identification information of the control message transmitted from the execution control module 130 to the management modules 120 1 to 120 3. Communicates identification information of control messages exchanged between the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3, and identification information of the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 The log analysis units 142 1 to 141 3 read out the communication patterns and transmit the control messages and control messages that were not transmitted based on the read communication patterns and the execution logs 121 1 to 121 3. that could not manage module 120 1-120 3 or the control object Since identify the source 1101 3, it is possible to identify the cause of a communication failure device.

ところで、上記実施例1では、通信データ取得部1401〜1403が、管理モジュール1201〜1203から出力された実行ログ1211〜1213をそれぞれ取得し、管理モジュールごとに、通信エラーが発生した原因を特定する場合について説明した。しかしながら、各管理モジュールから出力された実行ログを横断的に検査することによって、各管理モジュールにより行われる処理の間の相関関係や因果関係を考慮したうえで、通信エラーの原因を特定するようにしてもよい。 In the first embodiment, the communication data acquisition units 140 1 to 140 3 acquire the execution logs 121 1 to 121 3 output from the management modules 120 1 to 120 3 , respectively. The case where the cause that occurred was specified was explained. However, by checking the execution log output from each management module, the cause of the communication error should be specified in consideration of the correlation and causality between the processes performed by each management module. May be.

そこで、以下では、このような場合を本実施例2として説明する。なお、ここでは説明の便宜上、図2に示した各部と同様の役割を果たす機能部については同一符号を付すこととしてその詳細な説明を省略する。   Therefore, in the following, such a case will be described as a second embodiment. Here, for convenience of explanation, functional units that play the same functions as the respective units shown in FIG.

まず、本実施例2に係るITリソース制御装置の概要および構成について説明する。図7は、本実施例2に係るITリソース制御装置の概要および構成を説明するための図である。同図に示すように、このITリソース制御装置200は、自律運用により制御対象リソース1101〜1103を制御する装置であり、管理モジュール1201〜1203と、実行制御モジュール130と、通信データ取得部2401〜2403と、ログ収集モジュール250とを有する。 First, the outline and configuration of the IT resource control apparatus according to the second embodiment will be described. FIG. 7 is a diagram for explaining the outline and configuration of the IT resource control apparatus according to the second embodiment. As shown in the figure, the IT resource control device 200 is a device that controls the control target resources 110 1 to 110 3 by autonomous operation, and includes management modules 120 1 to 120 3 , an execution control module 130, and communication data. Acquisition units 240 1 to 240 3 and a log collection module 250 are included.

本実施例2に係るITリソース制御装置200では、管理モジュール1201〜1203および実行制御モジュール130は、それぞれ、図14に示した管理モジュール20および実行制御モジュール30と同じ機能を有するものであるが、通信データ取得部2401〜2403と、ログ収集モジュール250を有する点が、図14に示したITシステムとは異なっている。 In the IT resource control apparatus 200 according to the second embodiment, the management modules 120 1 to 120 3 and the execution control module 130 have the same functions as the management module 20 and the execution control module 30 shown in FIG. 14, respectively. but a communication data acquiring unit 240 1 to 240 3, that it has a logging module 250 is different from that of the iT system shown in FIG. 14.

通信データ取得部2401〜2403は、管理モジュール1201〜1203によって出力された実行ログ1211〜1213を取得し、ログ収集モジュール250に対して出力する処理部である。 Communication data acquisition unit 240 1 to 240 3 obtains the management module 120 1-120 3 execution logs 121 1 to 121 3 output by a processing unit that outputs to the log collection module 250.

ログ収集モジュール250は、通信データ取得部2401〜2403から出力された実行ログ1211〜1213に基づいて、実行制御モジュール130と管理モジュール1201〜1203との間で行われる通信、または、管理モジュール1201〜1203と制御対象リソース1101〜1103にとの間で行われる通信に発生した通信エラーに係る情報を出力する処理部である。 Logging module 250, a communication based on the communication data acquisition unit 240 1 to 240 3 execution logs 121 1 to 121 3 output from, performed between the execution control module 130 and the management module 120 1-120 3, Alternatively, the processing unit outputs information related to a communication error that has occurred in communication performed between the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 3 .

ログ収集モジュール250は、同図に示すように、結合通信パターンリポジトリ251と、結合ログ解析部252とを有する。以下、ログ収集モジュール250が有する各機能部について説明する。   The log collection module 250 includes a combined communication pattern repository 251 and a combined log analysis unit 252 as shown in FIG. Hereinafter, each functional unit included in the log collection module 250 will be described.

結合通信パターンリポジトリ251は、実行制御モジュール130から管理モジュール1201〜1203に対して送信される指示メッセージと、その制御メッセージに基づいて管理モジュール1201〜1203と制御対象リソース1101〜1103との間でやり取りされる制御メッセージの組とを対応付けた通信パターンを、指示メッセージごとに記憶する記憶部である。 The combined communication pattern repository 251 includes an instruction message transmitted from the execution control module 130 to the management modules 120 1 to 120 3 , and the management modules 120 1 to 120 3 and the control target resources 110 1 to 110 based on the control message. 3 is a storage unit that stores, for each instruction message, a communication pattern in which a set of control messages exchanged with 3 is associated.

図8は、本実施例2に係る結合通信パターンリポジトリ251の一例を示す図である。同図に示すように、この結合通信パターンリポジトリ251は、具体的には、「送信元」、「宛先」、「プロトコル」、「制御内容」、「パラメータ」を、実行ログ1211に記録される通信データの項目に対応するように記憶する。同図(a)および(b)に示す結合通信パターンリポジトリは、それぞれ、図2の(a)および(b)に示した実行ログを出力する管理モジュールAおよび管理モジュールBの結合通信パターンリポジトリを示している。 FIG. 8 is a diagram illustrating an example of the combined communication pattern repository 251 according to the second embodiment. As shown in the figure, in the combined communication pattern repository 251, specifically, “transmission source”, “destination”, “protocol”, “control content”, and “parameter” are recorded in the execution log 121 1. It memorizes corresponding to the item of communication data. The combined communication pattern repositories shown in FIGS. 2A and 2B are the combined communication pattern repositories of the management module A and the management module B that output the execution logs shown in FIGS. 2A and 2B, respectively. Show.

ここで、結合通信パターンリポジトリ251は、上記の項目を記憶する点は、実施例1で説明した通信パターンリポジトリ1411〜1413(図3を参照)と同様であるが、さらに、制御メッセージごとに「制約および他プロセスへの影響」を対応付けて記憶する。ここで、「制約および他プロセスへの影響」は、当該制御メッセージの送信が他の制御メッセージの送信に及ぼす影響を示す情報である。 Here, the point that the combined communication pattern repository 251 stores the above items is the same as the communication pattern repositories 141 1 to 141 3 (see FIG. 3) described in the first embodiment. Are stored in association with “constraints and effects on other processes”. Here, the “constraint and influence on other processes” is information indicating the influence of the transmission of the control message on the transmission of another control message.

例えば、「制約および他プロセスへの影響」には、排他投入が必須であることを示す情報や(図8(a)に示すNo.=1の制御メッセージを参照)、該当リソースを使用する他プロセスが強制的に失敗することを示す情報(図8(a)に示すNo.=6の制御メッセージを参照)、処理の対象となるユーザがすでにログイン中である場合は失敗することを示す情報(図8(b)に示すNo.=6の制御メッセージを参照)などが設定される。なお、他の制御メッセージの送信に何ら影響を及ぼさないものについては、「制約および他プロセスへの影響」は何も設定されない。   For example, in the “constraint and influence on other processes”, information indicating that exclusive input is essential (refer to the control message of No. = 1 shown in FIG. 8A), the use of the corresponding resource, etc. Information indicating that the process is forcibly failed (see the control message of No. 6 shown in FIG. 8A), and information indicating that the process is failed if the user to be processed is already logged in (Refer to the control message No. 6 shown in FIG. 8B). Note that “constraints and effects on other processes” are not set for anything that does not affect the transmission of other control messages.

図7に戻って、結合ログ解析部252は、通信データ取得部2401〜2403から出力された実行ログ1211〜1213および結合通信パターンリポジトリ2511に基づいて、通信エラーの原因を特定し、特定した通信エラーの原因に係る情報を含めたログ解析結果254を出力する処理部である。 Returning to FIG. 7, the combined log analysis unit 252 identifies the cause of the communication error based on the execution logs 121 1 to 121 3 and the combined communication pattern repository 251 1 output from the communication data acquisition units 240 1 to 240 3. And a processing unit that outputs a log analysis result 254 including information relating to the cause of the identified communication error.

具体的には、この結合ログ解析部252は、まず、通信データ取得部2401〜2403によって出力された実行ログ1211〜1213を収集し、収集した実行ログ1211〜1213を結合して結合ログ253を生成する。図9は、本実施例2に係る結合ログ253の一例を示す図である。同図は、図2の(a)および(b)に示した実行ログを結合した場合の結合ログ253を示している。 Specifically, the coupling log analyzer 252 first collects execution logs 121 1 to 121 3 output by the communication data obtaining unit 240 1 to 240 3, coupling an execution log 121 1 to 121 3 collected Thus, the combined log 253 is generated. FIG. 9 is a diagram illustrating an example of the combined log 253 according to the second embodiment. This figure shows a combined log 253 when the execution logs shown in FIGS. 2A and 2B are combined.

図9に示すNo.c=1〜7、16および17の通信データは、図2の(b)に示した実行ログに含まれていた通信データであり、No.c=8〜15の通信データは、図2の(a)に示した実行ログに含まれていた通信データである。   No. shown in FIG. The communication data of c = 1 to 7, 16, and 17 are the communication data included in the execution log shown in FIG. The communication data of c = 8-15 is the communication data included in the execution log shown in FIG.

結合ログ253を生成するとともに、結合ログ解析部252は、通信データ取得部2401〜2403から出力された実行ログ1211〜1213を、それぞれ、管理モジュールごとおよびセッションごとに分割する。 While generating the combined log 253, the combined log analysis unit 252 divides the execution logs 121 1 to 121 3 output from the communication data acquisition units 240 1 to 240 3 for each management module and each session.

続いて、結合ログ解析部252は、管理モジュールごとおよびセッションごとに分割された実行ログ1211〜1213を、結合通信パターンリポジトリ251に記憶された通信パターンと比較することによって、実施例1で説明したログ解析部1421〜1423と同様に、実行制御モジュール130と管理モジュール1201〜1203との間で行われた通信、または、管理モジュール1201〜1203と制御対象リソース1101〜1103にとの間で行われた通信に異常が発生しているか否かを判定し、異常が発生していると判定した場合には、異常の原因となった通信データ、すなわち、正常に送受信が行われなかった通信データを特定する。 Subsequently, the combined log analysis unit 252 compares the execution logs 121 1 to 121 3 divided for each management module and for each session with the communication patterns stored in the combined communication pattern repository 251 in the first embodiment. Similar to the described log analysis units 142 1 to 142 3 , communication performed between the execution control module 130 and the management modules 120 1 to 120 3 , or the management modules 120 1 to 120 3 and the control target resource 110 1. abnormality determining whether occurred to communications performed between the 110 3, when it is determined that an abnormality has occurred, the communication data that caused the anomaly, i.e., normal The communication data that has not been transmitted or received is specified.

ここで、結合ログ解析部252は、さらに、結合ログ253、および、結合通信パターンリポジトリ251に記憶された通信パターンに基づいて、異常として特定した通信データに対して影響を及ぼした他の通信データが存在するか否かを確認する。   Here, the combined log analysis unit 252 further determines other communication data that has influenced the communication data identified as abnormal based on the combined log 253 and the communication pattern stored in the combined communication pattern repository 251. Check whether or not exists.

そして、結合ログ解析部252は、異常の原因となった通信データに係る情報と、さらに、当該通信データに影響を及ぼした通信データが存在していた場合には、その通信データに係る情報とを含めたログ解析結果254を生成して、出力する。   Then, the combined log analysis unit 252 includes information related to the communication data that has caused the abnormality, and information related to the communication data if there is communication data that has affected the communication data. A log analysis result 254 including is generated and output.

次に、上記で説明した結合ログ解析部252の処理手順について、詳細に説明する。図10は、本実施例2に係る結合ログ解析部252の処理手順を示すフローチャートである。同図に示すように、結合ログ解析部252は、まず、実行ログ1211〜1213に基づいて結合ログ253を生成し(ステップS401)、さらに、実行ログ1211〜1213を管理モジュールおよびセッション単位で切り分け、管理モジュール/セッション毎実行ログとして内部メモリに記憶する(ステップS402)。 Next, the processing procedure of the combined log analysis unit 252 described above will be described in detail. FIG. 10 is a flowchart illustrating the processing procedure of the combined log analysis unit 252 according to the second embodiment. As shown in the figure, the combined log analysis unit 252 first generates a combined log 253 based on the execution logs 121 1 to 121 3 (step S401), and further stores the execution logs 121 1 to 121 3 as management modules and It is divided in units of sessions and stored in the internal memory as a management module / per-session execution log (step S402).

続いて、結合ログ解析部252は、内部メモリに記憶した管理モジュール/セッション毎実行ログおよび結合通信パターンリポジトリ251に基づいて、実施例1で説明したログ解析部1421〜1423と同様に、実行制御モジュール130と管理モジュール1201〜1203との間で行われた通信、または、管理モジュール1201〜1203と制御対象リソース1101〜1103にとの間で行われた通信に異常が発生しているか否かを判定する(ステップS403)。 Subsequently, the combined log analysis unit 252 is based on the management module / session execution log and the combined communication pattern repository 251 stored in the internal memory, similarly to the log analysis units 142 1 to 142 3 described in the first embodiment. communication is performed between the execution control module 130 and the management module 120 1-120 3, or abnormal communications performed between the management module 120 1-120 3 and the control target resource 1101 3 Whether or not has occurred is determined (step S403).

ここで、異常が発生していなかった場合には(ステップS404,No)、結合ログ解析部252は、判定結果を「正常」とし(ステップS405)、処理を終了する。一方、異常が発生していた場合には(ステップS404,Yes)、判定結果を「異常」とし(ステップS406)、依存関係による原因箇所判定処理を行い(ステップS407)、処理を終了する。なお、この依存関係による原因箇所判定処理については、以下に詳細に説明する。   If no abnormality has occurred (step S404, No), the combined log analysis unit 252 sets the determination result to “normal” (step S405) and ends the process. On the other hand, if an abnormality has occurred (step S404, Yes), the determination result is “abnormal” (step S406), a cause location determination process based on the dependency is performed (step S407), and the process ends. The cause location determination process based on this dependency will be described in detail below.

次に、図10に示した依存関係による原因箇所判定処理の処理手順について説明する。図11は、図10に示した依存関係による原因箇所判定処理の処理手順を示すフローチャートである。また、図12は、依存関係による原因箇所特定処理の一例を示す図であり、同図の(a)に示す結合ログは、図9に示した結合ログと同じものを示しており、同図の(b)に示す結合通信パターンリポジトリは、図8の(a)に示した結合通信パターンリポジトリと同じものを示している。   Next, the procedure of the cause location determination process based on the dependency shown in FIG. 10 will be described. FIG. 11 is a flowchart illustrating a processing procedure of a cause location determination process based on the dependency relationship illustrated in FIG. 10. FIG. 12 is a diagram showing an example of the cause location specifying process based on the dependency relationship. The combined log shown in FIG. 12A is the same as the combined log shown in FIG. The combined communication pattern repository shown in FIG. 8B is the same as the combined communication pattern repository shown in FIG.

図11に示すように、この依存関係による原因箇所判定処理では、結合ログ解析部252は、まず、結合ログ253と、内部メモリに記憶された未完了パターンおよび管理モジュール/セッション毎実行ログとを読み込む(ステップS501)。   As shown in FIG. 11, in the cause location determination process based on this dependency relationship, the combined log analysis unit 252 first combines the combined log 253, the incomplete pattern stored in the internal memory, and the management module / session execution log. Read (step S501).

続いて、結合ログ解析部252は、実施例1で説明した原因箇所判定処理(図6を参照)と同様の手順で、実行ログにおいて、未完了パターンに含まれるメッセージと一致しない最初の通信データを抽出する(ステップS502)。   Subsequently, the combined log analysis unit 252 performs the same procedure as the cause location determination process (see FIG. 6) described in the first embodiment, and the first communication data that does not match the message included in the uncompleted pattern in the execution log. Is extracted (step S502).

ここで、例えば、実行ログが、図2(a)に示した実行ログであり、未完了パターンが、図3(a)に示した通信パターンであったとすると、結合ログ解析部252は、これらを比較し、図2(a)の実行ログのNo.=7の通信データを抽出する。   Here, for example, if the execution log is the execution log shown in FIG. 2A and the incomplete pattern is the communication pattern shown in FIG. 3A, the combined log analysis unit 252 And the No. of the execution log in FIG. = 7 communication data is extracted.

そして、結合ログ解析部252は、抽出した通信データと結合ログ253との対応付けを行う(ステップS503)。具体的には、結合ログ解析部252は、抽出した通信データに基づいて結合ログ253を検索し、当該通信データに対応する通信データを特定する。   Then, the combined log analysis unit 252 associates the extracted communication data with the combined log 253 (step S503). Specifically, the combined log analysis unit 252 searches the combined log 253 based on the extracted communication data, and specifies communication data corresponding to the communication data.

例えば、図12(a)に示す結合ログを用いた場合には、結合ログ解析部252は、上記で例にあげた図2(a)の実行ログのNo.=7の通信データに対応する通信データとして、図12(a)の(1)に示す通信データを特定する。   For example, when the combined log shown in FIG. 12 (a) is used, the combined log analysis unit 252 displays the No. of the execution log in FIG. The communication data shown in (1) of FIG. 12A is specified as the communication data corresponding to the communication data = 7.

また、結合ログ解析部252は、結合通信パターンリポジトリ251から、「制約および他プロセスへの影響」に値が設定されている通信パターンを全て抽出した後に(ステップS504)、抽出した通信パターンと結合ログ253との対応付けを行う(ステップS505)。具体的には、結合ログ解析部252は、抽出した通信パターンに基づいて結合ログ253を検索し、当該通信パターンに一致する通信データを特定する。   Further, the combined log analysis unit 252 extracts all communication patterns having values set in the “constraint and influence on other processes” from the combined communication pattern repository 251 (step S504), and then combines with the extracted communication patterns. Association with the log 253 is performed (step S505). Specifically, the combined log analysis unit 252 searches the combined log 253 based on the extracted communication pattern, and specifies communication data that matches the communication pattern.

例えば、図12(a)に示す結合ログを用いた場合には、結合ログ解析部252は、同図(b)の(2)に示す通信パターンとして、同図(a)の(3)に示す通信データを特定する。   For example, when the combined log shown in FIG. 12A is used, the combined log analysis unit 252 uses the communication pattern shown in (2) of FIG. The communication data to be indicated is specified.

そして、結合ログ解析部252は、ステップS505で特定した通信データによる制約の影響範囲を評価する(ステップS506)。具体的には、結合ログ解析部252は、ステップS503で特定した通信データが、ステップS505で特定した通信データによる制約の影響を受けているか否かを判定する。ここで、ある通信データによる制約の影響有無を判定する方法は、当該通信データに対応する通信パターンの「制約および他プロセスへの影響」の種類に応じてあらかじめ決められているものとする。   Then, the combined log analysis unit 252 evaluates the influence range of the restriction by the communication data specified in step S505 (step S506). Specifically, the combined log analysis unit 252 determines whether or not the communication data identified in step S503 is affected by the restriction due to the communication data identified in step S505. Here, it is assumed that a method for determining whether or not there is an influence of a restriction by certain communication data is determined in advance according to the type of “restriction and influence on other processes” of the communication pattern corresponding to the communication data.

例えば、図12(a)の(3)に示す通信データによる制約の影響範囲は、「制約および他プロセスへの影響」が「該当リソースを使用する他プロセスは強制的に失敗」であることから、当該通信データによる制約の影響を受ける通信データは、影響を与える通信データより後に送信された通信データであって、さらに、処理対象の制御対象リソースが同じである通信データとなる。これにより、図12に示す例では、同図(a)の(1)に示している通信データは、(3)に示す通信データによる制約の影響を受けていることになる。   For example, the range of influence of the restriction by the communication data shown in (3) of FIG. 12A is that “the restriction and the influence on other processes” is “the other process using the corresponding resource is forcibly failed”. The communication data that is affected by the restriction due to the communication data is communication data that is transmitted after the communication data that affects the communication data, and is communication data that has the same control target resource to be processed. Thus, in the example shown in FIG. 12, the communication data shown in (1) of FIG. 12A is affected by the restriction due to the communication data shown in (3).

こうして、結合ログ解析部252は、ステップS503で特定した通信データがステップS505で特定した通信データによる制約の影響を受けているか否かを判定し、影響を受けていないと判定した場合には(ステップS507,No)、通信データの因果関係は不明であると判定する(ステップS508)。   Thus, the combined log analysis unit 252 determines whether or not the communication data specified in step S503 is affected by the restriction by the communication data specified in step S505. In step S507, No), it is determined that the causal relationship of the communication data is unknown (step S508).

一方、影響を受けていると判定した場合には(ステップS507,Yes)、結合ログ解析部252は、ステップS505で特定したデータを原因となった制約として、ステップS503で特定した通信デーデータを障害として、それぞれの通信データに係る情報を含めたログ解析結果254を生成し、生成したログ解析結果254を出力する(ステップS509)。   On the other hand, when it determines with having received the influence (step S507, Yes), the combined log analysis part 252 uses the communication data data specified by step S503 as a constraint which caused the data specified by step S505. As a failure, a log analysis result 254 including information related to each communication data is generated, and the generated log analysis result 254 is output (step S509).

上述してきたように、本実施例2では、実行制御モジュール130が複数の管理モジュール1201〜1203に対して指示メッセージをそれぞれ送信した場合に、ログ収集モジュール250が、複数の管理モジュール1201〜1203から実行ログ1211〜1213を収集し、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報(結合通信パターンリポジトリ251の「制約および他プロセスへの影響」)に基づいて、送信されなかった制御メッセージに対して影響を及ぼした制御メッセージを特定するので、ある制御メッセージの送信において通信エラーが発生した場合に、その制御メッセージの送信に影響を及ぼした他の制御メッセージを特定することが可能になり、通信エラーが発生した根本的な原因を特定することができる。 As described above, in the second embodiment, when the execution control module 130 transmits an instruction message to each of the plurality of management modules 120 1 to 120 3 , the log collection module 250 uses the plurality of management modules 120 1. Execution information 121 1 to 121 3 is collected from ˜120 3, and the influence information storing information related to the influence of the transmission of the control message on the transmission of other control messages (“restriction and other processes to the combined communication pattern repository 251” is stored. The control message that affected the control message that was not transmitted is identified based on the influence of the control message), so that if a communication error occurs in the transmission of a certain control message, the control message transmission is affected. It is possible to identify other control messages It is possible to identify the root cause.

なお、上記実施例では、ITリソース制御装置が、3台の管理モジュールを有する場合について説明したが、本発明はこれに限られるわけではなく、3台未満の管理モジュールまたは3台より多い管理モジュールを有する場合にも同様に適用することができる。   In the above embodiment, the case where the IT resource control apparatus has three management modules has been described. However, the present invention is not limited to this, and less than three management modules or more than three management modules. The same can be applied to the case of having.

また、上記実施例では、管理モジュール、実行制御モジュール、通信データ取得部およびログ収集モジュールが、全て1台のITリソース制御装置に備えられた場合について説明したが、各処理部は、それぞれ異なる装置に備えられていてもよい。   In the above embodiment, the case where the management module, the execution control module, the communication data acquisition unit, and the log collection module are all provided in one IT resource control device has been described. However, each processing unit is a different device. May be provided.

また、上記実施例では、ITリソース制御装置について説明したが、上記で説明した構成をソフトウェアによって実現することで、同様の機能を有する通信エラー情報出力プログラムを得ることができる。そこで、この通信エラー情報出力プログラムを実行するコンピュータについて説明する。   Moreover, although the IT resource control apparatus has been described in the above embodiment, a communication error information output program having the same function can be obtained by realizing the configuration described above by software. A computer that executes this communication error information output program will be described.

図13は、通信エラー情報出力プログラムを実行するコンピュータの構成を示す機能ブロック図である。同図に示すように、このコンピュータ300は、RAM(Random Access Memory)310と、CPU(Central Processing Unit)320と、HDD(Hard Disk Drive)330と、LAN(Local Area Network)インタフェース340と、入出力インタフェース350と、DVD(Digital Versatile Disk)ドライブ360とを有する。   FIG. 13 is a functional block diagram illustrating a configuration of a computer that executes a communication error information output program. As shown in the figure, the computer 300 includes a RAM (Random Access Memory) 310, a CPU (Central Processing Unit) 320, an HDD (Hard Disk Drive) 330, a LAN (Local Area Network) interface 340, and an input. An output interface 350 and a DVD (Digital Versatile Disk) drive 360 are included.

RAM310は、プログラムやプログラムの実行途中結果などを記憶するメモリであり、CPU320は、RAM310からプログラムを読み出して実行する中央処理装置である。   The RAM 310 is a memory that stores a program, a program execution result, and the like. The CPU 320 is a central processing unit that reads a program from the RAM 310 and executes the program.

HDD330は、プログラムやデータを格納するディスク装置であり、LANインタフェース340は、コンピュータ300をLAN経由で他のコンピュータに接続するためのインタフェースである。   The HDD 330 is a disk device that stores programs and data, and the LAN interface 340 is an interface for connecting the computer 300 to other computers via the LAN.

入出力インタフェース350は、マウスやキーボードなどの入力装置および表示装置を接続するためのインタフェースであり、DVDドライブ360は、DVDの読み書きを行う装置である。   The input / output interface 350 is an interface for connecting an input device such as a mouse or a keyboard and a display device, and the DVD drive 360 is a device for reading / writing a DVD.

そして、このコンピュータ300において実行される通信エラー情報出力プログラム311は、DVDに記憶され、DVDドライブ360によってDVDから読み出されてコンピュータ300にインストールされる。   The communication error information output program 311 executed in the computer 300 is stored in the DVD, read from the DVD by the DVD drive 360, and installed in the computer 300.

あるいは、この通信エラー情報出力プログラム311は、LANインタフェース340を介して接続された他のコンピュータシステムのデータベースなどに記憶され、これらのデータベースから読み出されてコンピュータ300にインストールされる。   Alternatively, the communication error information output program 311 is stored in a database or the like of another computer system connected via the LAN interface 340, read from these databases, and installed in the computer 300.

そして、インストールされた通信エラー情報出力プログラム311は、HDD330に記憶され、RAM310に読み出されてCPU320によって通信エラー情報出力プロセス321として実行される。   The installed communication error information output program 311 is stored in the HDD 330, read out to the RAM 310, and executed by the CPU 320 as the communication error information output process 321.

また、上記実施例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。   In addition, among the processes described in the above embodiment, all or a part of the processes described as being automatically performed can be manually performed, or the processes described as being performed manually can be performed. All or a part can be automatically performed by a known method.

この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。   In addition, the processing procedure, control procedure, specific name, and information including various data and parameters shown in the above-described document and drawings can be arbitrarily changed unless otherwise specified.

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。   Each component of each illustrated device is functionally conceptual and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution / integration of each device is not limited to that shown in the figure, and all or a part thereof may be functionally or physically distributed or arbitrarily distributed in arbitrary units according to various loads or usage conditions. Can be integrated and configured.

さらに、各装置にて行われる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。   Furthermore, all or a part of each processing function performed in each device may be realized by a CPU and a program that is analyzed and executed by the CPU, or may be realized as hardware by wired logic.

(付記1)第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータに実行させる通信エラー情報出力プログラムであって、
前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手順と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手順と、
前記未送信制御メッセージ特定手順により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手順と、
をコンピュータに実行させることを特徴とする通信エラー情報出力プログラム。
(Supplementary note 1) In an information processing system in which a first device controls a third device via a second device, communication performed between the first device and the second device or a second device A communication error information output program for causing a computer to execute output processing of information related to a communication error that has occurred in communication performed with a third device,
Communication for obtaining a communication log in which a communication message exchanged between the second device and the third device is recorded in response to a control message transmitted from the first device to the second device Log acquisition procedure;
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Reading the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition procedure, an unsent control message specifying procedure for specifying an unsent control message that has not been transmitted,
A control message information output procedure for outputting information related to an unsent control message identified by the unsent control message identification procedure;
A communication error information output program for causing a computer to execute

(付記2)前記通信ログ取得手順は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、
前記未送信制御メッセージ特定手順は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする付記1に記載の通信エラー情報出力プログラム。
(Appendix 2) The communication log acquisition procedure collects communication logs from the plurality of second devices when the first device transmits control messages to the plurality of second devices, respectively.
The unsent control message identification procedure identifies the control message that has influenced the unsent control message based on the influence information that stores information related to the effect of the transmission of the control message on the transmission of other control messages. The communication error information output program according to appendix 1, wherein:

(付記3)前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、
前記未送信制御メッセージ特定手順は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする付記1または2に記載の通信エラー情報出力プログラム。
(Supplementary Note 3) The control message correspondence information is exchanged between the second device and the third device in association with the identification information of the control message transmitted from the first device to the second device. Storing the identification information of the control message and the identification information of the third device,
The unsent control message specifying procedure reads the control message correspondence information, and based on the read control message correspondence information and the communication log acquired by the communication log acquisition procedure, an unsent control message that has not been transmitted and The communication error information output program according to appendix 1 or 2, wherein the second device or the third device that has failed to transmit the control message is specified.

(付記4)第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータが実行する通信エラー情報出力方法であって、
前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得工程と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得工程により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定工程と、
前記未送信制御メッセージ特定工程により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力工程と、
を含んだことを特徴とする通信エラー情報出力方法。
(Appendix 4) In an information processing system in which the first device controls the third device via the second device, communication between the first device and the second device or the second device A communication error information output method in which a computer executes output processing of information relating to a communication error that has occurred in communication performed with a third device,
Communication for obtaining a communication log in which a communication message exchanged between the second device and the third device is recorded in response to a control message transmitted from the first device to the second device Log acquisition process;
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Reading the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition step, an unsent control message specifying step for specifying an unsent control message that has not been transmitted,
A control message information output step for outputting information related to the untransmitted control message specified by the untransmitted control message specifying step;
A communication error information output method comprising:

(付記5)前記通信ログ取得工程は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、
前記未送信制御メッセージ特定工程は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする付記4に記載の通信エラー情報出力方法。
(Appendix 5) The communication log acquisition step collects communication logs from the plurality of second devices when the first device transmits a control message to each of the plurality of second devices.
The unsent control message identifying step identifies a control message that has influenced the unsent control message based on the influence information that stores information related to the effect of the transmission of the control message on the transmission of another control message. The communication error information output method according to appendix 4, wherein:

(付記6)前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、
前記未送信制御メッセージ特定工程は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得工程により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする付記4または5に記載の通信エラー情報出力方法。
(Supplementary Note 6) The control message correspondence information is exchanged between the second device and the third device in association with the identification information of the control message transmitted from the first device to the second device. Storing the identification information of the control message and the identification information of the third device,
The unsent control message specifying step reads out the control message correspondence information, and based on the read control message correspondence information and the communication log acquired by the communication log acquisition step, an unsent control message that has not been transmitted and 6. The communication error information output method according to appendix 4 or 5, wherein the second device or the third device that has failed to transmit the control message is specified.

(付記7)第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報を出力する通信エラー情報出力装置であって、
前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手段と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手段により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手段と、
前記未送信制御メッセージ特定手段により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手段と、
を備えたことを特徴とする通信エラー情報出力装置。
(Supplementary note 7) In the information processing system in which the first device controls the third device via the second device, communication between the first device and the second device or the second device A communication error information output device that outputs information related to a communication error that has occurred in communication performed with a third device,
Communication for obtaining a communication log in which a communication message exchanged between the second device and the third device is recorded in response to a control message transmitted from the first device to the second device Log acquisition means;
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Read the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition means, an unsent control message specifying means for specifying an unsent control message that has not been transmitted,
Control message information output means for outputting information related to the untransmitted control message specified by the untransmitted control message specifying means;
A communication error information output device comprising:

(付記8)前記通信ログ取得手段は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、
前記未送信制御メッセージ特定手段は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする付記7に記載の通信エラー情報出力装置。
(Appendix 8) The communication log acquisition means collects communication logs from the plurality of second devices when the first device transmits control messages to the plurality of second devices, respectively.
The unsent control message specifying means specifies the control message that has influenced the unsent control message based on the influence information that stores information related to the effect of the transmission of the control message on the transmission of another control message. The communication error information output device according to appendix 7, wherein:

(付記9)前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、
前記未送信制御メッセージ特定手段は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手段により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする付記7または8に記載の通信エラー情報出力装置。
(Supplementary note 9) The control message correspondence information is exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device. Storing the identification information of the control message and the identification information of the third device,
The unsent control message specifying means reads the control message correspondence information, and based on the read control message correspondence information and the communication log acquired by the communication log acquisition means, an unsent control message that has not been transmitted and 9. The communication error information output device according to appendix 7 or 8, wherein the second device or the third device that cannot transmit the control message is specified.

以上のように、本発明に係る通信エラー情報出力プログラム、通信エラー情報出力方法および通信エラー情報出力装置は、自律運用によってITシステムのリソースを制御する場合に有用であり、特に、ITシステムに通信エラーが発生した際に、その原因を速やかに特定することが求められる場合に適している。   As described above, the communication error information output program, the communication error information output method, and the communication error information output device according to the present invention are useful when controlling IT system resources by autonomous operation, and in particular, communicate with the IT system. It is suitable when it is required to quickly identify the cause when an error occurs.

本実施例1に係るITリソース制御装置の概要および構成を説明するための図である。BRIEF DESCRIPTION OF THE DRAWINGS FIG. 1 is a diagram for explaining an overview and a configuration of an IT resource control apparatus according to a first embodiment. 本実施例1に係る管理モジュールにより出力される実行ログの一例を示す図である。It is a figure which shows an example of the execution log output by the management module which concerns on the present Example 1. FIG. 本実施例1に係る通信パターンリポジトリの一例を示す図である。It is a figure which shows an example of the communication pattern repository which concerns on the present Example 1. FIG. 本実施例1に係るログ解析部の処理手順を示すフローチャートである。6 is a flowchart illustrating a processing procedure of a log analysis unit according to the first embodiment. 図4に示した正常/異常判定処理の処理手順を示すフローチャートである。FIG. 5 is a flowchart showing a processing procedure of normality / abnormality determination processing shown in FIG. 4. FIG. 図4に示した原因箇所判定処理の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the cause location determination process shown in FIG. 本実施例2に係るITリソース制御装置の概要および構成を説明するための図である。It is a figure for demonstrating the outline | summary and structure of the IT resource control apparatus which concern on the present Example 2. FIG. 本実施例2に係る結合通信パターンリポジトリの一例を示す図である。It is a figure which shows an example of the combined communication pattern repository which concerns on the present Example 2. FIG. 本実施例2に係る結合ログの一例を示す図である。It is a figure which shows an example of the combined log which concerns on the present Example 2. FIG. 本実施例2に係る結合ログ解析部の処理手順を示すフローチャートである。10 is a flowchart illustrating a processing procedure of a combined log analysis unit according to the second embodiment. 図10に示した依存関係による原因箇所判定処理の処理手順を示すフローチャートである。It is a flowchart which shows the process sequence of the cause location determination process by the dependency shown in FIG. 依存関係による原因箇所特定処理の一例を示す図である。It is a figure which shows an example of the cause location specific process by dependency. 通信エラー情報出力プログラムを実行するコンピュータの構成を示す機能ブロック図である。It is a functional block diagram which shows the structure of the computer which executes a communication error information output program. 従来のITシステムにおける自律運用を説明するための図である。It is a figure for demonstrating the autonomous operation in the conventional IT system. 従来のITシステムにおける自律運用の課題を説明するための図である。It is a figure for demonstrating the subject of the autonomous operation in the conventional IT system.

符号の説明Explanation of symbols

100,200 ITリソース制御装置
1101〜1103 制御対象リソース
1201〜1203 管理モジュール
1211〜1213 実行ログ
130 実行制御モジュール
1401〜1403,2401〜2403 通信データ取得部
1411〜1413 通信パターンリポジトリ
1421〜1423 ログ解析部
1431〜1433,254 ログ解析結果
250 ログ収集モジュール
251 結合通信パターンリポジトリ
252 結合ログ解析部
253 結合ログ
300 コンピュータ
310 RAM
311 通信エラー情報出力プログラム
320 CPU
321 通信エラー情報出力プロセス
330 HDD
340 LANインタフェース
350 入出力インタフェース
360 DVDドライブ
1 運用管理手順
10 リソース
20 管理モジュール
30 実行制御モジュール
CM1,CM2 指示メッセージ
RM1,RM2 応答メッセージ
100, 200 IT resource control device 1101 3 controlled object resource 120 1-120 3 management module 121 1-121 3 Execution Log 130 execution control module 140 1-140 3, 240 1 to 240 3 communication data acquiring unit 141 1 -141 3 Communication pattern repository 142 1 -142 3 Log analysis unit 143 1 -143 3 , 254 Log analysis result 250 Log collection module 251 Combined communication pattern repository 252 Combined log analysis unit 253 Combined log 300 Computer 310 RAM
311 Communication error information output program 320 CPU
321 Communication error information output process 330 HDD
340 LAN interface 350 I / O interface 360 DVD drive 1 operation management procedure 10 resource 20 management module 30 execution control module CM1, CM2 instruction message RM1, RM2 response message

Claims (5)

第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータに実行させる通信エラー情報出力プログラムであって、前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手順と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手順と、
前記未送信制御メッセージ特定手順により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手順と、
をコンピュータに実行させることを特徴とする通信エラー情報出力プログラム。
In the information processing system in which the first device controls the third device via the second device, communication performed between the first device and the second device or the second device and the third device A communication error information output program for causing a computer to execute output processing of information relating to a communication error occurring in communication performed between the first device and the control message transmitted from the first device to the second device A communication log acquisition procedure for acquiring a communication log in which a communication message exchanged between the second device and the third device is recorded according to
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Reading the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition procedure, an unsent control message specifying procedure for specifying an unsent control message that has not been transmitted,
A control message information output procedure for outputting information related to an unsent control message identified by the unsent control message identification procedure;
A communication error information output program for causing a computer to execute
前記通信ログ取得手順は、前記第一の装置が複数の第二の装置に対して制御メッセージをそれぞれ送信した場合に、前記複数の第二の装置から通信ログを収集し、
前記未送信制御メッセージ特定手順は、制御メッセージの送信が他の制御メッセージの送信に及ぼす影響に係る情報を記憶した影響情報に基づいて、未送信制御メッセージに対して影響を及ぼした制御メッセージを特定することを特徴とする請求項1に記載の通信エラー情報出力プログラム。
The communication log acquisition procedure collects communication logs from the plurality of second devices when the first device transmits control messages to the plurality of second devices, respectively.
The unsent control message identification procedure identifies the control message that has influenced the unsent control message based on the influence information that stores information related to the effect of the transmission of the control message on the transmission of other control messages. The communication error information output program according to claim 1, wherein:
前記制御メッセージ対応情報は、第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報および第三の装置の識別情報を記憶し、
前記未送信制御メッセージ特定手順は、前記制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手順により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージおよび制御メッセージを送信できなかった第二の装置または第三の装置を特定することを特徴とする請求項1または2に記載の通信エラー情報出力プログラム。
The control message correspondence information is a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device. Storing the identification information and the identification information of the third device,
The unsent control message specifying procedure reads the control message correspondence information, and based on the read control message correspondence information and the communication log acquired by the communication log acquisition procedure, an unsent control message that has not been transmitted and The communication error information output program according to claim 1 or 2, wherein the second device or the third device that cannot transmit the control message is specified.
第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報の出力処理をコンピュータが実行する通信エラー情報出力方法であって、
前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得工程と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得工程により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定工程と、
前記未送信制御メッセージ特定工程により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力工程と、
を含んだことを特徴とする通信エラー情報出力方法。
In the information processing system in which the first device controls the third device via the second device, communication performed between the first device and the second device or the second device and the third device A communication error information output method in which a computer executes output processing of information relating to a communication error that has occurred in communication performed between
Communication for obtaining a communication log in which a communication message exchanged between the second device and the third device is recorded in response to a control message transmitted from the first device to the second device Log acquisition process;
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Reading the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition step, an unsent control message specifying step for specifying an unsent control message that has not been transmitted,
A control message information output step for outputting information related to the untransmitted control message specified by the untransmitted control message specifying step;
A communication error information output method comprising:
第一の装置が第二の装置を介して第三の装置を制御する情報処理システムにおいて、第一の装置と第二の装置との間で行われる通信または第二の装置と第三の装置との間で行われる通信に発生した通信エラーに係る情報を出力する通信エラー情報出力装置であって、
前記第一の装置から第二の装置に対して送信された制御メッセージに応じて前記第二の装置と第三の装置との間でやり取りされた通信メッセージが記録された通信ログを取得する通信ログ取得手段と、
前記第一の装置から第二の装置宛てに送信される制御メッセージの識別情報に対応付けて前記第二の装置と第三の装置との間でやり取りされる制御メッセージの識別情報を記憶した制御メッセージ対応情報を読み出し、読み出した制御メッセージ対応情報と、前記通信ログ取得手段により取得された通信ログとに基づいて、送信されなかった未送信制御メッセージを特定する未送信制御メッセージ特定手段と、
前記未送信制御メッセージ特定手段により特定された未送信制御メッセージに係る情報を出力する制御メッセージ情報出力手段と、
を備えたことを特徴とする通信エラー情報出力装置。
In the information processing system in which the first device controls the third device via the second device, communication performed between the first device and the second device or the second device and the third device A communication error information output device that outputs information related to a communication error that has occurred in communication performed between
Communication for obtaining a communication log in which a communication message exchanged between the second device and the third device is recorded in response to a control message transmitted from the first device to the second device Log acquisition means;
A control storing identification information of a control message exchanged between the second device and the third device in association with identification information of a control message transmitted from the first device to the second device Read the message correspondence information, based on the read control message correspondence information and the communication log acquired by the communication log acquisition means, an unsent control message specifying means for specifying an unsent control message that has not been transmitted,
Control message information output means for outputting information related to the untransmitted control message specified by the untransmitted control message specifying means;
A communication error information output device comprising:
JP2007013864A 2007-01-24 2007-01-24 COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE Expired - Fee Related JP4257364B2 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2007013864A JP4257364B2 (en) 2007-01-24 2007-01-24 COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE
US12/017,864 US7739420B2 (en) 2007-01-24 2008-01-22 Communication error information output method, communication error information output device and recording medium therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007013864A JP4257364B2 (en) 2007-01-24 2007-01-24 COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE

Publications (2)

Publication Number Publication Date
JP2008181299A true JP2008181299A (en) 2008-08-07
JP4257364B2 JP4257364B2 (en) 2009-04-22

Family

ID=39642350

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007013864A Expired - Fee Related JP4257364B2 (en) 2007-01-24 2007-01-24 COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE

Country Status (2)

Country Link
US (1) US7739420B2 (en)
JP (1) JP4257364B2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020591A (en) * 2011-07-14 2013-01-31 Kddi Corp Dependency graph creation device, failure occurrence location diagnosis system, failure occurrence location diagnosis method and computer program
WO2014155650A1 (en) * 2013-03-29 2014-10-02 株式会社日立製作所 Information controller, information control system, and information control method
WO2014192641A1 (en) * 2013-05-27 2014-12-04 株式会社日立製作所 Computer system and method for specifying obstacle

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101594701B1 (en) * 2014-10-20 2016-02-16 삼성에스디에스 주식회사 Apparatus and method for detecting abnormal connection

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5047977A (en) * 1988-04-08 1991-09-10 International Business Machines Corporation Methods of generating and retrieving error and task message records within a multitasking computer system
JP3183678B2 (en) 1991-07-24 2001-07-09 日本電信電話株式会社 Communication control method
JP3351318B2 (en) * 1997-11-07 2002-11-25 株式会社日立製作所 Computer system monitoring method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013020591A (en) * 2011-07-14 2013-01-31 Kddi Corp Dependency graph creation device, failure occurrence location diagnosis system, failure occurrence location diagnosis method and computer program
WO2014155650A1 (en) * 2013-03-29 2014-10-02 株式会社日立製作所 Information controller, information control system, and information control method
JPWO2014155650A1 (en) * 2013-03-29 2017-02-16 株式会社日立製作所 Information control apparatus, information control system, and information control method
US9874869B2 (en) 2013-03-29 2018-01-23 Hitachi, Ltd. Information controller, information control system, and information control method
WO2014192641A1 (en) * 2013-05-27 2014-12-04 株式会社日立製作所 Computer system and method for specifying obstacle
JP2014229249A (en) * 2013-05-27 2014-12-08 株式会社日立製作所 Computing system and fault identification method
US9852031B2 (en) 2013-05-27 2017-12-26 Hitachi, Ltd. Computer system and method of identifying a failure

Also Published As

Publication number Publication date
US20080177901A1 (en) 2008-07-24
JP4257364B2 (en) 2009-04-22
US7739420B2 (en) 2010-06-15

Similar Documents

Publication Publication Date Title
CN100451989C (en) Software testing system and testing method
CN111052087A (en) Control system, information processing device, and abnormality factor estimation program
KR101948927B1 (en) Collaborative test device
US6985786B2 (en) Method for managing manufacturing data
KR20070113168A (en) System building guide system
JP5268589B2 (en) Information processing apparatus and information processing apparatus operating method
JP4257364B2 (en) COMMUNICATION ERROR INFORMATION OUTPUT PROGRAM, COMMUNICATION ERROR INFORMATION OUTPUT METHOD, AND COMMUNICATION ERROR INFORMATION OUTPUT DEVICE
CN112988555A (en) Interface test method, device, equipment and storage medium
CN118473979A (en) Simulation test method, system and terminal for vehicle communication
CN102955466B (en) For the method running automated system
US20230306343A1 (en) Business process management system and method thereof
US20090313230A1 (en) Computing job information managing device, terminal, and computing job information managing system
CN119536170A (en) Production Information Integration System Based on Visual Configuration
EP1780946B1 (en) Consensus testing of electronic system
JP6436704B2 (en) Test execution device, test execution method, and computer program
JPH10133916A (en) Problem analysis method in computer system and medium recording problem analysis tool in computer system
Rodrigues et al. Multi-approach debugging of industrial IoT workflows
US11880194B2 (en) Control device, logging method, and recording medium having program recorded thereon
KR101888792B1 (en) Method for data communication and system comprising the same
JP6353759B2 (en) Test execution device, test execution method, and computer program
JP2007233918A (en) Log information collection system, information processor, log information collection method and program
CN112015681B (en) IO port processing method, device, equipment and medium
Nguyen et al. Towards Bridging Industrial Ethernet Networks: Protocol Translation and Runtime Verification
CN121486219A (en) Operation and maintenance analysis method and system based on multi-agent cooperation
Khan Generic Model Based Architecture for Implementing Client Side Algorithms Used in Unified Diagnostic Service and On Board Diagnostics for Different Hardware Targets

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081205

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090127

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090202

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120206

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130206

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140206

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees