JP2015095105A - Recovery procedure update system, recovery procedure update method, and recovery support program - Google Patents
Recovery procedure update system, recovery procedure update method, and recovery support program Download PDFInfo
- Publication number
- JP2015095105A JP2015095105A JP2013234294A JP2013234294A JP2015095105A JP 2015095105 A JP2015095105 A JP 2015095105A JP 2013234294 A JP2013234294 A JP 2013234294A JP 2013234294 A JP2013234294 A JP 2013234294A JP 2015095105 A JP2015095105 A JP 2015095105A
- Authority
- JP
- Japan
- Prior art keywords
- recovery
- automation
- support system
- log file
- operation log
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Debugging And Monitoring (AREA)
Abstract
【課題】自動化フローを修正する工数を削減できるようにする。
【解決手段】自動化フロー290を実行することで、監視対象機器120にて発生した障害に対する対応を行う作業自動化システム220を有する復旧手順更新システム1であって、自動化フロー290を復旧させるためのコマンドの入力の履歴である操作ログファイル270を生成する復旧支援システム230を有し、復旧支援システム230は、自動化フロー290を復旧させるプログラムである復旧用スクリプト280を、操作ログファイル270に含まれるコマンドに基づき更新する。
【選択図】図1An object of the present invention is to reduce the number of steps for correcting an automation flow.
A recovery procedure update system 1 having a work automation system 220 for handling a failure that occurs in a monitored device 120 by executing an automation flow 290, and a command for restoring the automation flow 290 A recovery support system 230 that generates an operation log file 270 that is an input history of the command, and the recovery support system 230 uses a command included in the operation log file 270 for a recovery script 280 that is a program for recovering the automation flow 290. Update based on
[Selection] Figure 1
Description
本発明は、復旧手順更新システムおよび復旧手順更新方法ならびに復旧支援プログラムに関する。 The present invention relates to a recovery procedure update system, a recovery procedure update method, and a recovery support program.
障害監視運用業務では、サービスデスクが、監視対象機器に発生する障害に対する一次的な対応(以下、ワークアラウンドと呼ぶ場合がある)を行っている。昨今、監視対象機器の複雑化に伴い、ワークアラウンドの処理件数が増加してきている。そして、自動でワークアラウンドを行うために、システムの運用を自動化させるRBA(Run Book Automation)が導入されている。また、システムの運用を自動化するための製品であるRBAツールは、運用を自動化するための運用手順(以下、自動化フローと呼ぶ場合がある)を有している。 In the fault monitoring operation business, the service desk performs a primary response (hereinafter sometimes referred to as workaround) to a fault that occurs in the monitoring target device. In recent years, the number of workaround processes has increased with the increasing complexity of monitored devices. In order to automatically perform workaround, RBA (Run Book Automation) that automates system operation has been introduced. An RBA tool, which is a product for automating system operation, has an operation procedure for automating operation (hereinafter sometimes referred to as an automation flow).
例えば、特開2009−181441号公報(特許文献1)がある。この公報には、「各クライアントは、不具合発生時に、自己の識別情報及び時刻データを含むインシデント情報を抽出するインシデントデータ抽出部と、予め定められている不具合の判定条件を示す判定条件データに基づいて、不具合が発生しているか否かを判定するチェックリスト処理部と、不具合が発生しているときは、発生している不具合を解消するために、判定条件データに予め対応付けられているコマンドを実行する修復コマンド実行部と、インシデントデータ及びコマンドの実行結果を示す情報を、管理サーバ送信する」と記載されている。 For example, there exists Unexamined-Japanese-Patent No. 2009-181441 (patent document 1). According to this publication, “each client is based on an incident data extraction unit that extracts incident information including its own identification information and time data when a defect occurs, and determination condition data indicating predetermined defect determination conditions. A check list processing unit that determines whether or not a failure has occurred, and a command that is associated in advance with determination condition data in order to eliminate the failure that has occurred, if a failure has occurred. The management command is transmitted to the repair command execution unit that executes the command, and the incident data and the information indicating the command execution result ”.
特許文献1に記載された技術は、特定の監視対象機器に発生する障害に対するワークアラウンドを自動で行うことができる。 The technique described in Patent Literature 1 can automatically perform workaround for a failure that occurs in a specific monitoring target device.
ここで、自動化フローによる運用が失敗した場合、自動化フローを復旧させることが必要になる。自動化フローを復旧させるためのコマンドは、各監視対象機器のソフトウェアおよびハードウェアの構成ごとに異なる。監視対象機器が複数の顧客のシステムである場合、各監視対象機器のソフトウェアおよびハードウェアの構成が異なり、対応するコマンドを各自動化フローに適用するのに多くの工数が必要になるという問題があった。 Here, when the operation by the automation flow fails, it is necessary to restore the automation flow. The command for restoring the automation flow differs depending on the software and hardware configuration of each monitored device. When the monitored device is a system of multiple customers, the software and hardware configurations of each monitored device are different, and a lot of man-hours are required to apply the corresponding command to each automation flow. It was.
本発明の目的は、自動化フローを修正する工数を削減可能にする技術を提供することである。 An object of the present invention is to provide a technique that makes it possible to reduce the number of steps for correcting an automation flow.
本願において開示される発明のうち、代表的なものの概要を簡単に説明すれば、次の通りである。 Of the inventions disclosed in the present application, the outline of typical ones will be briefly described as follows.
本発明の一実施の形態は、自動化フローを実行することで、監視対象機器にて発生した障害に対する対応を行う作業自動化システムを有する復旧手順更新システムであって、前記自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する復旧支援システムを有する。また、前記復旧支援システムは、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する。 An embodiment of the present invention is a recovery procedure update system having a work automation system that performs a response to a failure that has occurred in a monitored device by executing an automation flow, and for restoring the automation flow It has a recovery support system that generates an operation log file that is a history of command input. The recovery support system updates a recovery script, which is a program for recovering the automation flow, based on the command included in the operation log file.
また、他の実施の形態では、自動化フローを実行することで、監視対象機器にて発生した障害に対する対応を行う作業自動化システムを有する復旧手順更新システムを用いた復旧手順更新方法であって、復旧支援システムが、前記自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する操作ログファイル生成ステップを有する。また、前記復旧支援システムが、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する、復旧用スクリプト更新ステップを有する。 In another embodiment, the present invention provides a recovery procedure update method using a recovery procedure update system having a work automation system for handling a failure that occurs in a monitored device by executing an automation flow. The support system includes an operation log file generation step of generating an operation log file that is a history of command input for restoring the automation flow. The recovery support system further includes a recovery script update step of updating a recovery script, which is a program for recovering the automation flow, based on the command included in the operation log file.
また、他の実施の形態では、自動化フローを実行することで、監視対象機器にて発生した障害に対する対応を行う復旧手順更新システムが有する復旧支援システムとしてコンピュータを機能させるための復旧支援プログラムであって、前記復旧支援システムが、自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する操作ログファイル生成ステップを前記復旧支援システムのコンピュータに実行させる。また、前記復旧支援システムが、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する、復旧用スクリプト更新ステップを前記復旧支援システムのコンピュータに実行させる。 In another embodiment, there is a recovery support program for causing a computer to function as a recovery support system included in a recovery procedure update system that performs a response to a failure that occurs in a monitored device by executing an automation flow. Then, the recovery support system causes the computer of the recovery support system to execute an operation log file generation step of generating an operation log file that is a history of command input for recovering the automation flow. Further, the recovery support system updates a recovery script, which is a program for recovering the automation flow, based on the command included in the operation log file, and executes a recovery script update step on the computer of the recovery support system Let
本願において開示される発明のうち、代表的なものによって得られる効果を簡単に説明すれば以下のとおりである。 Among the inventions disclosed in the present application, effects obtained by typical ones will be briefly described as follows.
本発明の代表的な実施の形態によれば、自動化フローを修正する工数を削減できるようになる。 According to the representative embodiment of the present invention, the number of steps for correcting the automation flow can be reduced.
以下、本発明の実施の形態を図面に基づいて詳細に説明する。なお、実施の形態を説明するための全図において、同一部には原則として同一の符号を付し、その繰り返しの説明は省略する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. Note that components having the same function are denoted by the same reference symbols throughout the drawings for describing the embodiment, and the repetitive description thereof will be omitted.
本発明の一実施の形態における復旧手順更新システムは、自動化フローを実行することで、監視対象機器にて発生した障害に対する対応を行う作業自動化システムを有する。また、実行した自動化フローにエラーが発生した後、自動化フローを復旧させるプログラムである復旧用スクリプトを実行する。復旧用スクリプトを実行しても自動化フローが復旧しない場合には、サービスデスクから操作を受け付けることで、自動化フローを復旧させる。そして、復旧用スクリプトを、サービスデスクから受け付けた入力の履歴である操作ログファイルに基づき更新することで、次回以降は、自動で自動化フローを復旧させることができるようになる。 The recovery procedure update system according to an embodiment of the present invention includes a work automation system that performs a response to a failure that occurs in a monitored device by executing an automation flow. In addition, after an error occurs in the executed automation flow, a recovery script that is a program for restoring the automation flow is executed. If the automation flow does not recover even after executing the recovery script, the automation flow is recovered by accepting an operation from the service desk. Then, by updating the recovery script based on an operation log file that is an input history received from the service desk, the automated flow can be automatically recovered from the next time.
<システム構成>
図1は、本発明の一実施の形態における、復旧手順更新システム1の構成例の概要を示す図である。
<System configuration>
FIG. 1 is a diagram showing an outline of a configuration example of a recovery procedure update system 1 according to an embodiment of the present invention.
本発明の一実施の形態における復旧手順更新システム1は、データセンタ100と、データセンタ100とネットワークを介して接続される監視センタ200とを有する。 A recovery procedure update system 1 according to an embodiment of the present invention includes a data center 100 and a monitoring center 200 connected to the data center 100 via a network.
データセンタ100は、障害監視装置110と、複数の監視対象機器120とを有する。 The data center 100 includes a failure monitoring apparatus 110 and a plurality of monitoring target devices 120.
監視センタ200は、インシデント管理システム210と、作業自動化システム220と、復旧支援システム230と、サービスデスク端末240と、運用SE端末250と、インシデントDB260とを有する。 The monitoring center 200 includes an incident management system 210, a work automation system 220, a recovery support system 230, a service desk terminal 240, an operation SE terminal 250, and an incident DB 260.
また、障害監視装置110と、監視対象機器120と、インシデント管理システム210と、作業自動化システム220と、復旧支援システム230と、サービスデスク端末240と、運用SE端末250は、所定のハードウェアおよびソフトウェアにより実装される。例えば、障害監視装置110と、監視対象機器120と、インシデント管理システム210と、作業自動化システム220と、復旧支援システム230と、サービスデスク端末240と、運用SE端末250とは、それぞれプロセッサやメモリなどを有し、プロセッサにより実行されるメモリ上のプログラムが、障害監視装置110と、監視対象機器120と、インシデント管理システム210と、作業自動化システム220と、復旧支援システム230と、サービスデスク端末240と、運用SE端末250との各コンピュータを機能させる。 In addition, the failure monitoring apparatus 110, the monitoring target device 120, the incident management system 210, the work automation system 220, the recovery support system 230, the service desk terminal 240, and the operation SE terminal 250 have predetermined hardware and software. Implemented by. For example, the failure monitoring apparatus 110, the monitoring target device 120, the incident management system 210, the work automation system 220, the recovery support system 230, the service desk terminal 240, and the operation SE terminal 250 are each a processor, a memory, and the like. And the program on the memory executed by the processor includes the failure monitoring device 110, the monitoring target device 120, the incident management system 210, the work automation system 220, the recovery support system 230, and the service desk terminal 240. Then, each computer with the operational SE terminal 250 is caused to function.
監視対象機器120は、監視対象機器120内に障害が発生すると、障害メッセージ(後述、図2)を障害監視装置110へ入力する。 When a failure occurs in the monitoring target device 120, the monitoring target device 120 inputs a failure message (described later, FIG. 2) to the failure monitoring apparatus 110.
障害監視装置110は、入力された障害メッセージを監視センタ200へ送信する。 The failure monitoring apparatus 110 transmits the input failure message to the monitoring center 200.
監視センタ200のインシデント管理システム210は、障害監視装置110から送信された障害メッセージを受信する。そして、インシデント管理システム210は、受信した障害メッセージをインシデントDB260に記憶する。さらに、インシデント管理システム210は、作業自動化システム220に自動化フロー290(後述、図4)の実行を指示する。 The incident management system 210 of the monitoring center 200 receives the failure message transmitted from the failure monitoring device 110. Then, the incident management system 210 stores the received failure message in the incident DB 260. Further, the incident management system 210 instructs the work automation system 220 to execute an automation flow 290 (described later, FIG. 4).
作業自動化システム220は、自動化フロー290を実行する。また、自動化フロー290の処理中にエラーが発生し、その後、自動化フロー290が復旧されない場合、作業自動化システム220は、復旧支援システム230へ復旧指示情報を入力する。 The work automation system 220 executes an automation flow 290. Further, when an error occurs during the processing of the automation flow 290 and the automation flow 290 is not restored thereafter, the work automation system 220 inputs restoration instruction information to the restoration support system 230.
復旧支援システム230は、復旧指示情報が入力された場合、対応要否一覧画面(後述、図7)をサービスデスク端末240の表示部(例えば、ディスプレイ)に表示させる。 When the recovery instruction information is input, the recovery support system 230 displays a response necessity list screen (described later, FIG. 7) on a display unit (for example, a display) of the service desk terminal 240.
サービスデスク端末240の操作端末(例えば、キーボード)は、サービスデスク20から、自動化フロー290を復旧させるためのコマンドの入力を受け付ける。 An operation terminal (for example, a keyboard) of the service desk terminal 240 receives an input of a command for restoring the automation flow 290 from the service desk 20.
復旧支援システム230は、サービスデスク20から受け付けた入力の履歴である操作ログファイル270を生成する。 The recovery support system 230 generates an operation log file 270 that is an input history received from the service desk 20.
復旧支援システム230は、自動化フロー290を復旧させるプログラムである復旧用スクリプト280を、操作ログファイル270に含まれる、コマンドに基づき更新する。 The recovery support system 230 updates the recovery script 280, which is a program for recovering the automation flow 290, based on the command included in the operation log file 270.
<インシデントDB>
図2は、本発明の一実施の形態における、インシデントDB260が記憶するデータの構成例を示す図である。図2に示されるようにインシデントDB260は、[障害ID]と[区分]と障害メッセージとを対応付けて記憶する。
<Incident DB>
FIG. 2 is a diagram illustrating a configuration example of data stored in the incident DB 260 according to the embodiment of this invention. As shown in FIG. 2, the incident DB 260 stores [failure ID], [classification], and a failure message in association with each other.
[障害ID]は、障害を識別するための符号を示す。なお、[障害ID]は、障害メッセージがインシデントDB260に記憶される際に自動で割り振られる。[区分]は、復旧用スクリプトの更新が必要であるか否かを示す。「対応不要」は、復旧用スクリプトの更新が不要であることを示す。また、「対応要」は、復旧用スクリプトの更新が必要であることを示す。なお、[区分]は、初期値として「対応不要」が記憶されている。 [Fault ID] indicates a code for identifying a fault. [Fault ID] is automatically assigned when a fault message is stored in the incident DB 260. [Category] indicates whether the recovery script needs to be updated. “No action required” indicates that it is not necessary to update the recovery script. “Action required” indicates that the recovery script needs to be updated. [Category] stores “no action required” as an initial value.
障害メッセージは、[発生日時]、[顧客名]、[障害内容]、などのデータ項目を有する。[発生日時]は、障害が発生した日時を示す。[顧客名]は、障害が発生した監視対象機器120を保有する顧客の名称を示す。[障害内容]は、障害の内容を示す。 The failure message has data items such as [occurrence date / time], [customer name], and [failure content]. [Occurrence date and time] indicates the date and time when the failure occurred. [Customer name] indicates the name of the customer who owns the monitoring target device 120 in which a failure has occurred. [Failure content] indicates the content of the failure.
<全体処理>
図3は、本発明の一実施の形態における、全体処理の概要を示す図である。
<Overall processing>
FIG. 3 is a diagram showing an overview of the overall processing in the embodiment of the present invention.
まず、S301にて、データセンタ100の各監視対象機器120は、障害が発生したかを判定する。いずれの監視対象機器120も障害が発生しないと判定する場合(S301−No)、S301へ進む。一方、いずれかの監視対象機器120が、障害が発生したと判定する場合(S301−Yes)、S302へ進む。 First, in S301, each monitoring target device 120 of the data center 100 determines whether a failure has occurred. When it is determined that no failure occurs in any monitored device 120 (S301-No), the process proceeds to S301. On the other hand, when any one of the monitoring target devices 120 determines that a failure has occurred (S301-Yes), the process proceeds to S302.
次に、S302にて、監視対象機器120は、障害メッセージ(前述、図2)を障害監視装置110へ入力する。 Next, in S <b> 302, the monitoring target device 120 inputs a failure message (described above, FIG. 2) to the failure monitoring apparatus 110.
次に、S303にて、障害監視装置110は、監視センタ200へ障害メッセージを送信する。 Next, in S303, the failure monitoring apparatus 110 transmits a failure message to the monitoring center 200.
次に、S304にて、監視センタ200のインシデント管理システム210は、障害監視装置110から送信された障害メッセージを受信する。そして、インシデント管理システム210は、受信した障害メッセージをインシデントDB260に記憶する。さらに、インシデント管理システム210は、作業自動化システム220に自動化フロー290の実行を指示する。 In step S <b> 304, the incident management system 210 of the monitoring center 200 receives the failure message transmitted from the failure monitoring apparatus 110. Then, the incident management system 210 stores the received failure message in the incident DB 260. Further, the incident management system 210 instructs the work automation system 220 to execute the automation flow 290.
次に、S305にて、作業自動化システム220は、自動化フロー290(後述、図4)を実行する。以下、図4を用いて、自動化フロー290について説明する。 Next, in S305, the work automation system 220 executes an automation flow 290 (described later, FIG. 4). Hereinafter, the automation flow 290 will be described with reference to FIG.
図4は、本発明の一実施の形態における、自動化フロー290の処理の概要を示す図である。 FIG. 4 is a diagram showing an outline of the processing of the automation flow 290 according to the embodiment of the present invention.
自動化フロー290は、ワークアラウンドである処理1および処理2と、処理1を復旧させるためのプログラムである処理1復旧処理と、処理2を復旧させるための処理である処理2復旧処理を含む。 The automation flow 290 includes processing 1 and processing 2 that are workarounds, processing 1 recovery processing that is a program for recovering processing 1, and processing 2 recovery processing that is processing for recovering processing 2.
処理1のエラートラップである処理1復旧処理は、処理1の処理中にエラーが発生した場合に、実行される。また、処理1復旧処理では、処理1を復旧させるための処理である処理1復旧用スクリプトが実行される。 The process 1 recovery process, which is an error trap of process 1, is executed when an error occurs during the process 1. In the process 1 recovery process, a process 1 recovery script that is a process for recovering process 1 is executed.
処理2のエラートラップである処理2復旧処理は、処理2の処理中にエラーが発生した場合に実行される。処理2復旧処理では、処理2を復旧させるためのプログラムである処理2復旧用スクリプトが実行される。以下、図5および図6を用いて処理1復旧用スクリプトの構成例について説明する。 The process 2 recovery process, which is an error trap of process 2, is executed when an error occurs during the process 2. In the process 2 recovery process, a process 2 recovery script, which is a program for recovering process 2, is executed. Hereinafter, a configuration example of the processing 1 recovery script will be described with reference to FIGS. 5 and 6.
図5は、本発明の一実施の形態における、更新前の処理1復旧用スクリプトの構成例の概要を示す図である。図5に示されるように、更新前の処理1復旧用スクリプトは、処理1を復旧させるためのコマンドを含まず、復旧支援システム230に復旧を指示するためのコマンド(以下、復旧指示情報と呼ぶ場合がある)を含む。また、復旧指示情報は、「[IncidentID:90][XXXX自動化フロー処理1][処理1復旧用スクリプト]でエラーが発生しました。サービスデスクで対応してください」などの文字列からなり、インシデントID(図5では、「90」が該当する)と、自動化フロー処理名(図5では、「XXXX自動化フロー処理1」が該当する)とを含む。 FIG. 5 is a diagram showing an outline of a configuration example of the script for the process 1 restoration before update in the embodiment of the present invention. As shown in FIG. 5, the script for processing 1 before update does not include a command for restoring processing 1, but a command for instructing the restoration support system 230 to restore (hereinafter referred to as restoration instruction information). In some cases). In addition, the recovery instruction information consists of a character string such as “[IncidentID: 90] [XXXXXX automated flow process 1] [Processing 1 recovery script]. Please respond at the service desk.” ID (“90” corresponds in FIG. 5) and an automation flow process name (“XXXX automation flow process 1” in FIG. 5).
図6は、本発明の一実施の形態における、更新後の処理1復旧用スクリプトの構成例の概要を示す図である。図6に示されるように、更新後の処理1復旧用スクリプトには、第1処理を復旧させるための各コマンドが追加されている。また、第1処理を復旧させるための各コマンドが実行される度に、正常に処理が実行されたかを判定する処理が追加されている。正常に処理が実行されない場合は、復旧指示処理が実行される。復旧指示処理が実行されると、作業自動化システム220は、復旧支援システム230へ復旧指示情報を入力する。なお、処理2復旧用スクリプトの構成は、処理1復旧用スクリプトの構成と同様である。また、処理1復旧用スクリプトおよび処理2復旧用スクリプトは、復旧手順選択画面(後述、図9)が表示された状態で運用SE端末250が、運用SE10から入力を受け付けることで適宜更新される。 FIG. 6 is a diagram showing an outline of a configuration example of the process 1 recovery script after the update according to the embodiment of the present invention. As shown in FIG. 6, each command for restoring the first process is added to the updated script for process 1 restoration. In addition, a process for determining whether or not the process has been executed normally is added each time a command for restoring the first process is executed. If the process is not executed normally, a recovery instruction process is executed. When the recovery instruction process is executed, the work automation system 220 inputs the recovery instruction information to the recovery support system 230. The configuration of the processing 2 recovery script is the same as the configuration of the processing 1 recovery script. Further, the processing 1 recovery script and the processing 2 recovery script are appropriately updated when the operation SE terminal 250 receives an input from the operation SE 10 in a state where a recovery procedure selection screen (described later, FIG. 9) is displayed.
再び図3を参照する。次に、S306にて、復旧支援システム230は、作業自動化システム220から復旧指示情報を入力されたかを判定する。復旧支援システム230が、復旧指示情報を入力されないと判定する場合(S306−No)、全体処理を終了する。一方、S306にて、復旧支援システム230が、復旧指示情報を入力されたと判定する場合(S306−Yes)、S307へ進む。 Refer to FIG. 3 again. In step S <b> 306, the recovery support system 230 determines whether recovery instruction information has been input from the work automation system 220. When the recovery support system 230 determines that the recovery instruction information is not input (S306-No), the entire process is terminated. On the other hand, when the recovery support system 230 determines in S306 that the recovery instruction information has been input (S306-Yes), the process proceeds to S307.
次に、S307にて、復旧支援システム230は、復旧指示情報に含まれるインシデントIDを抽出する。そして、復旧支援システム230は、抽出したインシデントIDをキーにインシデントDB260を検索し、キーに対応するレコードの[区分]を「対応要」へ更新する。 Next, in S307, the recovery support system 230 extracts the incident ID included in the recovery instruction information. Then, the recovery support system 230 searches the incident DB 260 using the extracted incident ID as a key, and updates the [classification] of the record corresponding to the key to “response required”.
次に、S308にて、復旧支援システム230は、インシデントDB260に記憶されるデータをすべて取得し、取得したデータに基づいてサービスデスク端末240の表示部(例えば、ディスプレイ)に対応要否一覧画面(後述、図7)を表示させる。以下、図7を用いて対応要否一覧画面について説明する。 Next, in S308, the recovery support system 230 acquires all the data stored in the incident DB 260, and on the display unit (for example, display) of the service desk terminal 240 based on the acquired data, the correspondence necessity list screen ( FIG. 7) to be described later is displayed. Hereinafter, the correspondence necessity list screen will be described with reference to FIG.
図7は、本発明の一実施の形態における、対応要否一覧画面の構成例の概要を示す図である。図7に示されるように、対応要否一覧画面には、[区分]が「対応要」であるレコードに含まれる[障害ID]と[発生日時]と[顧客名]と[障害内容]とを一覧で表示する対応要障害IDリスト701と、[区分]が「対応不要」であるレコードに含まれる[障害ID]と[発生日時]と[顧客名]と[障害内容]とを一覧で表示する対応不要障害IDリスト702とが表示される。対応要否一覧画面が表示されることで、サービスデスク20は、対応が必要な障害の概要について確認できるようになる。 FIG. 7 is a diagram showing an outline of a configuration example of a correspondence necessity list screen according to the embodiment of the present invention. As shown in FIG. 7, the response necessity list screen includes [Fault ID], [Occurrence Date / Time], [Customer Name], [Failure Content] included in the record whose [Category] is “Correspondence Required”. Corresponding list of necessary trouble IDs 701, and [failure ID], [occurrence date / time], [customer name], and [failure contents] included in the record whose [category] is "no action required" A display of an unnecessary response ID list 702 to be displayed is displayed. By displaying the response necessity list screen, the service desk 20 can confirm an outline of a failure that needs to be addressed.
再び図3を参照する。次に、S309にて、サービスデスク端末240の操作端末は、サービスデスク20から、自動化フロー290を復旧させるための入力を受け付ける。 Refer to FIG. 3 again. Next, in S <b> 309, the operation terminal of the service desk terminal 240 receives an input from the service desk 20 for restoring the automation flow 290.
次に、S310にて、復旧支援システム230は、サービスデスク20から受け付けた入力の履歴である操作ログファイル270を生成する。以下、図8を用いて操作ログファイル270について説明する。 Next, in S <b> 310, the recovery support system 230 generates an operation log file 270 that is an input history received from the service desk 20. Hereinafter, the operation log file 270 will be described with reference to FIG.
図8は、本発明の一実施の形態における、操作ログファイル270の構成例の概要を示す図である。図8に示されるように、操作ログファイル270には、インシデントID、実行されたコマンド、処理結果などの情報を含む。なお、コマンドは、「Ping A−Server」、「net stop」、「net start」、「http−Get www.xxxx.com」などが該当する。 FIG. 8 is a diagram showing an outline of a configuration example of the operation log file 270 according to the embodiment of the present invention. As shown in FIG. 8, the operation log file 270 includes information such as an incident ID, an executed command, and a processing result. The command corresponds to “Ping A-Server”, “net stop”, “net start”, “http-Get www.xxxx.com”, and the like.
再び図3を参照する。次に、S311にて、復旧支援システム230は、S307にて抽出したインシデントIDをキーに入力された操作ログファイル270を検索し、対応するコマンドをすべて取得する。例えば、インシデントID「90」をキーに図8に示される操作ログファイル270を検索した場合、復旧支援システム230は、対応するコマンドである「Ping A−Server」と「net stop」と「net start」と「http−Get www.xxxx.com」とを取得する。なお、復旧支援システム230は、障害が発生した時刻から現在の時刻までの間に生成された操作ログファイル270が存在するか否かを判定し、存在しない場合には、全体処理を終了するようにしても良い。 Refer to FIG. 3 again. Next, in S311, the recovery support system 230 searches the operation log file 270 input using the incident ID extracted in S307 as a key, and acquires all corresponding commands. For example, when the operation log file 270 shown in FIG. 8 is searched using the incident ID “90” as a key, the recovery support system 230 reads “Ping A-Server”, “net stop”, and “net start” corresponding commands. "And" http-Get www.xxxx.com ". Note that the recovery support system 230 determines whether or not the operation log file 270 generated between the time when the failure occurs and the current time exists, and if not, the entire process is terminated. Anyway.
次に、S312にて、復旧支援システム230は、復旧手順選択画面を運用SE端末250の表示部に表示させる。復旧手順選択画面では、復旧用スクリプト280に含まれるコマンドを選択する入力を受け付ける。以下、図9を用いて復旧手順選択画面について説明する。 Next, in S <b> 312, the recovery support system 230 displays a recovery procedure selection screen on the display unit of the operational SE terminal 250. In the recovery procedure selection screen, an input for selecting a command included in the recovery script 280 is accepted. Hereinafter, the recovery procedure selection screen will be described with reference to FIG.
図9は、本発明の一実施の形態における、復旧手順選択画面の構成例の概要を示す図である。図9に示されるように、復旧手順選択画面には、インシデントID901と、適用欄902と、コマンド903と、反映先904と、スクリプト名905と、OKボタン906が表示される。 FIG. 9 is a diagram showing an outline of a configuration example of the recovery procedure selection screen according to the embodiment of the present invention. As shown in FIG. 9, the recovery procedure selection screen displays an incident ID 901, an application column 902, a command 903, a reflection destination 904, a script name 905, and an OK button 906.
インシデントID901には、S307にて抽出したインシデントID901が表示される。また、コマンド903には、S311にて取得した各コマンド903が表示される。適用欄902には、運用SE10から受け付けた入力に応じて「●」または「○」が対応するコマンド903に対して表示される。反映先904にはS305にて入力された復旧指示情報に含まれる自動化フロー処理名が表示される。スクリプト名905は、運用SE10から入力を受け付けたスクリプト名905が表示される。運用SE端末250が、運用SE10から、OKボタン906が選択する入力を受け付けると、S313へ進む。 In the incident ID 901, the incident ID 901 extracted in S307 is displayed. In the command 903, each command 903 acquired in S311 is displayed. In the application column 902, “●” or “◯” is displayed for the corresponding command 903 according to the input received from the operation SE10. In the reflection destination 904, the automation flow process name included in the recovery instruction information input in S305 is displayed. As the script name 905, the script name 905 that has received an input from the operation SE10 is displayed. When the operational SE terminal 250 receives an input selected by the OK button 906 from the operational SE 10, the process proceeds to S313.
再び図3を参照する。次に、S313にて、復旧支援システム230は、図9に示される適用欄902に「●」が表示されたすべてのコマンド903を更新後の復旧用スクリプト280に追加する。さらに、復旧支援システム230は、追加したコマンド903が正常に実行されたかを判定する判定処理を更新後の復旧用スクリプト280に追加する。そして、復旧支援システム230は、更新前の復旧用スクリプト280(前述、図5)を、更新後の復旧用スクリプト280(前述、図6)へ更新する。 Refer to FIG. 3 again. Next, in S313, the recovery support system 230 adds all the commands 903 for which “●” is displayed in the application column 902 shown in FIG. 9 to the updated recovery script 280. Furthermore, the recovery support system 230 adds a determination process for determining whether the added command 903 has been executed normally to the updated recovery script 280. Then, the recovery support system 230 updates the recovery script 280 before update (described above, FIG. 5) to the updated recovery script 280 (described above, FIG. 6).
ここで、S310は、操作ログファイル生成ステップに相当する。また、S313は、復旧用スクリプト更新ステップに相当する。 Here, S310 corresponds to an operation log file generation step. S313 corresponds to a recovery script update step.
<本実施の形態の効果>
以上説明した本実施の形態における復旧手順更新システム1によれば、復旧用スクリプト280を、操作ログファイル270に含まれるコマンドに基づき更新することで、自動化フロー290を修正する工数を削減できるようになる。さらに、自動化フロー290の処理から分離した復旧用スクリプト280を更新することで、自動化フロー290の処理を変更することなく、自動化フロー290を復旧できるようになる。さらに、次回に同じ障害が発生した場合に、自動で自動化フロー290を復旧させることができるようになる。
<Effects of the present embodiment>
According to the recovery procedure update system 1 in the present embodiment described above, the man-hour for correcting the automation flow 290 can be reduced by updating the recovery script 280 based on the command included in the operation log file 270. Become. Furthermore, by updating the recovery script 280 separated from the processing of the automation flow 290, the automation flow 290 can be recovered without changing the processing of the automation flow 290. Furthermore, when the same failure occurs next time, the automated flow 290 can be automatically restored.
以上、本発明者によってなされた発明を実施の形態に基づき具体的に説明したが、本発明は前記実施の形態に限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能であることはいうまでもない。 As mentioned above, the invention made by the present inventor has been specifically described based on the embodiment. However, the present invention is not limited to the embodiment, and various modifications can be made without departing from the scope of the invention. Needless to say.
10…運用SE、20…サービスデスク、100…データセンタ、110…障害監視装置、120…監視対象機器、200…監視センタ、210…インシデント管理システム、220…作業自動化システム、230…復旧支援システム、240…サービスデスク端末、250…運用SE端末、260…インシデントDB、270…操作ログファイル、280…復旧用スクリプト、290…自動化フロー、701…対応要障害IDリスト、702…対応不要障害IDリスト、901…インシデントID、902…適用欄、903…コマンド、904…反映先、905…スクリプト名 DESCRIPTION OF SYMBOLS 10 ... Operation SE, 20 ... Service desk, 100 ... Data center, 110 ... Fault monitoring apparatus, 120 ... Monitored device, 200 ... Monitoring center, 210 ... Incident management system, 220 ... Work automation system, 230 ... Recovery support system, 240 ... Service desk terminal, 250 ... Operational SE terminal, 260 ... Incident DB, 270 ... Operation log file, 280 ... Recovery script, 290 ... Automation flow, 701 ... Corresponding fault ID list, 702 ... Corresponding fault ID list, 901 ... Incident ID, 902 ... Application column, 903 ... Command, 904 ... Reflection destination, 905 ... Script name
Claims (3)
前記自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する復旧支援システムを有し、
前記復旧支援システムは、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する、復旧手順更新システム。 It is a recovery procedure update system having a work automation system that responds to failures that occur in monitored devices by executing an automation flow,
A recovery support system that generates an operation log file that is a history of command input for recovering the automation flow;
The recovery support system is a recovery procedure update system in which a recovery script, which is a program for recovering the automation flow, is updated based on the command included in the operation log file.
復旧支援システムが、前記自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する操作ログファイル生成ステップと、
前記復旧支援システムが、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する、復旧用スクリプト更新ステップと、
を有する、復旧手順更新方法。 It is a recovery procedure update method using a recovery procedure update system having a work automation system that responds to failures that occur in monitored devices by executing an automation flow,
An operation log file generation step in which the recovery support system generates an operation log file that is a history of command input for recovering the automation flow;
A recovery script update step in which the recovery support system updates a recovery script, which is a program for recovering the automation flow, based on the command included in the operation log file;
A recovery procedure update method.
前記復旧支援システムが、自動化フローを復旧させるためのコマンドの入力の履歴である操作ログファイルを生成する操作ログファイル生成ステップと、
前記復旧支援システムが、前記自動化フローを復旧させるプログラムである復旧用スクリプトを、前記操作ログファイルに含まれる前記コマンドに基づき更新する、復旧用スクリプト更新ステップと、
を前記復旧支援システムのコンピュータに実行させる、復旧支援プログラム。 A recovery support program for causing a computer to function as a recovery support system possessed by a recovery procedure update system that responds to a failure that occurred in a monitored device by executing an automation flow,
An operation log file generating step for generating an operation log file that is a history of command input for the recovery support system to recover the automation flow;
A recovery script update step in which the recovery support system updates a recovery script, which is a program for recovering the automation flow, based on the command included in the operation log file;
A recovery support program for causing a computer of the recovery support system to execute
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013234294A JP2015095105A (en) | 2013-11-12 | 2013-11-12 | Recovery procedure update system, recovery procedure update method, and recovery support program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2013234294A JP2015095105A (en) | 2013-11-12 | 2013-11-12 | Recovery procedure update system, recovery procedure update method, and recovery support program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2015095105A true JP2015095105A (en) | 2015-05-18 |
Family
ID=53197461
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2013234294A Pending JP2015095105A (en) | 2013-11-12 | 2013-11-12 | Recovery procedure update system, recovery procedure update method, and recovery support program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2015095105A (en) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7731015B1 (en) * | 2025-03-26 | 2025-08-28 | 興安計装株式会社 | Operational Support System |
| JP7731014B1 (en) * | 2025-03-26 | 2025-08-28 | 興安計装株式会社 | Operational Support System |
-
2013
- 2013-11-12 JP JP2013234294A patent/JP2015095105A/en active Pending
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7731015B1 (en) * | 2025-03-26 | 2025-08-28 | 興安計装株式会社 | Operational Support System |
| JP7731014B1 (en) * | 2025-03-26 | 2025-08-28 | 興安計装株式会社 | Operational Support System |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US10843342B2 (en) | System and method for detecting and fixing robotic process automation failures | |
| CN104583968B (en) | Management system and management program | |
| US10354225B2 (en) | Method and system for process automation in computing | |
| JP2005346331A (en) | Failure recovery apparatus, method for restoring fault, manager apparatus, and program | |
| CN104636251B (en) | A kind of more browser compatibility method of testings and system | |
| US11010238B2 (en) | Management system of storage system | |
| US11244266B2 (en) | Incident response assisting device | |
| JP2015095105A (en) | Recovery procedure update system, recovery procedure update method, and recovery support program | |
| KR102194974B1 (en) | System for monitoring and controling electric power system for process verification | |
| US8402125B2 (en) | Method of managing operations for administration, maintenance and operational upkeep, management entity and corresponding computer program product | |
| JP6070040B2 (en) | Database system, database device, database failure recovery method and program | |
| JP6837017B2 (en) | Work procedure presentation device and work procedure presentation method, as well as automatic control device and automatic control method | |
| JP6436705B2 (en) | Test execution device, test execution method, and computer program | |
| CN119718745A (en) | Automatic fault diagnosis recovery system and method and electronic equipment | |
| JP2016071397A (en) | Test execution device, test execution method, and computer program | |
| JP2018120256A (en) | Setting operation input support apparatus and setting operation input support system | |
| CN115080288A (en) | Analysis system, method for presenting examination result thereof, and computer-readable medium | |
| JP5101447B2 (en) | Test support system | |
| JP4687995B2 (en) | GUI system | |
| US20220398143A1 (en) | Network monitoring apparatus, method, and program | |
| JP4530645B2 (en) | Computer system monitoring apparatus and monitoring method | |
| JP5492031B2 (en) | Work management system | |
| WO2024261819A1 (en) | Failure recovery assistance device, failure recovery assistance method, and program | |
| CN111177241A (en) | Data processing method, device and system, electronic equipment and storage medium thereof | |
| JP2010086109A (en) | Test support system |