[go: up one dir, main page]

JP2011134070A - Redundant state inspection device and program - Google Patents

Redundant state inspection device and program Download PDF

Info

Publication number
JP2011134070A
JP2011134070A JP2009292480A JP2009292480A JP2011134070A JP 2011134070 A JP2011134070 A JP 2011134070A JP 2009292480 A JP2009292480 A JP 2009292480A JP 2009292480 A JP2009292480 A JP 2009292480A JP 2011134070 A JP2011134070 A JP 2011134070A
Authority
JP
Japan
Prior art keywords
redundant
state
computer system
verified
state information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2009292480A
Other languages
Japanese (ja)
Other versions
JP4902728B2 (en
Inventor
Yuji Miyabe
祐次 宮部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MUFG Bank Ltd
Original Assignee
Bank of Tokyo Mitsubishi UFJ Trust Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bank of Tokyo Mitsubishi UFJ Trust Co filed Critical Bank of Tokyo Mitsubishi UFJ Trust Co
Priority to JP2009292480A priority Critical patent/JP4902728B2/en
Publication of JP2011134070A publication Critical patent/JP2011134070A/en
Application granted granted Critical
Publication of JP4902728B2 publication Critical patent/JP4902728B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知する。
【解決手段】冗長化された部分を有する検証対象のコンピュータ・システムについて、例えばディスク装置56の制御装置60と論理ディスクとの接続が冗長化されているか否かを表す情報等のように、冗長化の状態を表す各種の状態情報を取得し(102〜126)、今回の処理実行が初回であれば取得した状態情報をマスタとして記憶させ(130)、2回目以降の実行であれば取得した状態情報をマスタと比較し(132)、状態情報の各項目毎のマスタとの一致/不一致と、不一致の項目の状態情報の内容を端末装置に表示させる(136)。
【選択図】図3
A computer system having a redundant portion detects that a serious failure is caused when a failure occurs because the redundancy does not function effectively.
For a computer system to be verified having a redundant portion, redundancy such as information indicating whether or not the connection between a control device 60 of a disk device 56 and a logical disk is redundant is used. Various state information indicating the state of the conversion is acquired (102 to 126), and if the current process execution is the first time, the acquired state information is stored as a master (130), and if it is the second or subsequent execution, it is acquired The status information is compared with the master (132), and the contents of the status information of the mismatched items and the match / mismatch with each master of the status information are displayed on the terminal device (136).
[Selection] Figure 3

Description

本発明は冗長状態検証装置及びプログラムに係り、特に、冗長化された部分を有するコンピュータ・システムの状態を検証する冗長状態検証装置、及び、コンピュータを前記冗長状態検証装置として機能させるための冗長状態検証プログラムに関する。   The present invention relates to a redundant state verification device and a program, and more particularly to a redundant state verification device for verifying the state of a computer system having a redundant portion, and a redundant state for causing a computer to function as the redundant state verification device. It relates to the verification program.

コンピュータ・システムの耐障害性の向上にはシステム構成の冗長化が有効であり、安定稼働に対する要求水準の高いコンピュータ・システムでは、現用系が障害の発生により稼働を停止すると稼働状態へ切り替わる待機系が追加されたシステム構成が採用されることが一般的である。しかし、冗長化されたコンピュータ・システムであっても、例えばシステム環境を変更した等の場合に、システム環境の変更が予期せぬ影響を及ぼすことで、現用系が稼働を停止しても待機系が稼働状態へ切り替わらない等のように、冗長化が有効に機能しない状態に陥ることが生じ得る。そして、冗長化が有効に機能しない状態は、通常時は待機系が稼働していないために管理者が気付かないことも多く、この状態が見過ごされた場合、現用系が稼働を停止しても待機系が稼働状態へ切り替わらずに両系共に稼働停止状態となることで、大規模なシステム障害が引き起されるという問題があった。   In order to improve the fault tolerance of a computer system, redundancy of the system configuration is effective. In a computer system with a high level of requirement for stable operation, a standby system that switches to an operating state when the active system stops operation due to a failure. Generally, a system configuration to which is added is adopted. However, even in a redundant computer system, for example, when the system environment is changed, the change of the system environment has an unexpected effect, so that even if the active system stops operating, the standby system It may happen that the redundancy does not function effectively such that the system does not switch to the operating state. And when redundancy does not function effectively, the standby system is not normally operating and the administrator is often not aware. If this state is overlooked, the active system can stop operating. There was a problem that a large-scale system failure was caused by both systems becoming inactive without the standby system being switched to the active state.

上記に関連して特許文献1には、システム構成を検証する要求を受け取ると、システム構成の問題を識別するための1つ以上の規則を規則データを取得すると共に、システム構成に関する情報を含むシステム構成データを取得し、システム構成データを規則データに照らして検証し、システムのための全ての構成問題を識別する検証の結果を生成する技術が開示されている。   In relation to the above, Patent Document 1 receives a request for verifying a system configuration, obtains rule data for one or more rules for identifying a problem in the system configuration, and includes information related to the system configuration Techniques are disclosed for obtaining configuration data, verifying system configuration data against rule data, and generating verification results that identify all configuration problems for the system.

また特許文献2には、コンピュータ・システムを構築する際に用いるシステム構成情報を記したパラメータシートと、オペレーティング・システムの情報であるシステム構成情報と、の対応箇所を比較し、比較結果を一覧表で色分けした比較レポートを出力する技術が開示されている。   Patent Document 2 compares the corresponding parts of the parameter configuration sheet describing the system configuration information used when constructing the computer system with the system configuration information which is the operating system information, and lists the comparison results. A technique for outputting a comparison report color-coded in (1) is disclosed.

特開2003−330720号公報JP 2003-330720 A 特開2007−241533号公報JP 2007-241533 A

特許文献1に記載の技術は、規則データに基づいてシステム構成を検証する技術であるが、特許文献1には、冗長化された部分を有するコンピュータ・システムに対するシステム構成の検証について何ら記載されておらず、冗長化された部分のうち現用系は正常に稼働しているものの、待機系が稼働状態へ切り替わらない状態(冗長化が有効に機能しない状態)となっている可能性があるコンピュータ・システムに対し、冗長化が有効に機能しない状態をシステム構成の問題として識別することや、その識別のために必要な規則データの内容等については示唆すら見当たらない。   The technique described in Patent Document 1 is a technique for verifying a system configuration based on rule data. However, Patent Document 1 describes anything about verification of a system configuration for a computer system having a redundant portion. There is a possibility that the active system is operating normally in the redundant part, but the standby system may not be switched to the operating state (the state where redundancy does not function effectively) There is no suggestion of identifying the state where redundancy does not function effectively as a system configuration problem or the contents of rule data necessary for the identification.

また、特許文献2に記載の技術は、コンピュータ・システムを構築する際に用いたシステム構成情報(を記したパラメータシート)と、構築したコンピュータシステムから取得したシステム構成情報とを比較することで、システムの構築が当初の予定通りに行われたか否かを確認するものであり、この特許文献2にも、冗長化された部分を有するコンピュータ・システムに適用することや、当該コンピュータ・システムが冗長化が有効に機能する状態か否かを確認するための構成について何ら記載されていない。   In addition, the technique described in Patent Document 2 compares the system configuration information (parameter sheet describing the system configuration information used when the computer system is constructed) with the system configuration information acquired from the constructed computer system. This is to confirm whether or not the construction of the system has been performed as originally planned. This patent document 2 also applies to a computer system having a redundant portion, and the computer system is redundant. There is no description about the configuration for confirming whether or not the activation is a functioning state effectively.

本発明は上記事実を考慮して成されたもので、冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる冗長状態検証装置及び冗長状態検証プログラムを得ることが目的である。   The present invention has been made in consideration of the above facts, and a computer system having a redundant portion is in a state where a serious failure is caused when a failure occurs because the redundancy does not function effectively. An object of the present invention is to obtain a redundant state verification device and a redundant state verification program that can detect the occurrence of failure.

本願発明者は、冗長化された部分を有するコンピュータ・システムが、仮に冗長化が有効に機能しない状態であった場合に、現用系に障害が発生した際に冗長化が有効に機能しない状態であることが及ぼす影響の大きさ(システム障害の重大さ)を検証する作業を行った。その結果、冗長化が有効に機能しない状態であることが障害発生時に及ぼす影響の大きさは、冗長化が有効に機能しない状態がシステムの何れの部分に生じているかに応じて大きく相違することが明らかになった。そして、記憶装置を含むコンピュータ・システムにおける特に重大なシステム障害はコンピュータと記憶装置との通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、記憶装置のコントローラと記憶媒体本体との接続が冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、前記システムのコンピュータと記憶装置の記憶媒体本体との間のパスが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。   The inventor of the present application states that if a computer system having a redundant portion is in a state where redundancy is not functioning effectively, the redundancy does not function effectively when a failure occurs in the active system. The work of verifying the magnitude of the impact of something (the severity of system failure) was conducted. As a result, the magnitude of the effect that a failure does not function effectively when a failure occurs will vary greatly depending on which part of the system the redundancy does not function effectively. Became clear. A particularly serious system failure in a computer system including a storage device is a system failure in which communication between the computer and the storage device is interrupted. When a system failure is caused, the connection between the controller of the storage device and the storage medium body is made redundant, but the redundancy is not functioning effectively, and the computer of the system The path between the storage device and the storage medium main body of the storage device was made redundant, but it became clear that this redundancy was not functioning effectively.

上記に基づき請求項1記載の発明に係る冗長状態検証装置は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。   Based on the above, the redundant state verification device according to claim 1 inquires about the state of the redundant part in the computer system to be verified including the storage device, and the controller provided in the storage device and the controller First state information indicating whether or not the connection of the storage device to the storage medium body is redundant, and a path between the computer of the computer system to be verified and the storage medium body of the storage device Is acquired by the acquisition unit, the acquisition unit that acquires the state information including the second state information indicating whether or not is redundant, the storage unit that stores the state information acquired by the acquisition unit The state information is compared with the state information acquired in the past by the acquisition unit and stored in the storage unit. The redundant portion of the computer system, the redundancy is configured to include, and whether determining unit maintains the state of functioning effectively.

請求項1記載の発明では、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。   According to the first aspect of the present invention, the connection between the controller provided in the storage device and the storage medium main body of the storage device is made by inquiring about the state of the redundant part in the computer system to be verified including the storage device. First state information indicating whether or not the state is redundant, and whether or not the path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant The state information including the second state information representing is acquired by the acquisition unit, and the state information acquired by the acquisition unit is stored in the storage unit. The state information acquired by the acquisition unit is information indicating the current state of the redundant part of the computer system to be verified, and the determination unit stores the state information acquired by the acquisition unit in the past by the acquisition unit. Compared with the status information obtained and stored in the storage means, the redundant part of the computer system to be verified is in a state in which redundancy functions effectively (the active system has failed and is operating. When the system is stopped, it is determined whether or not the standby system is maintained in a state of switching to the operating state.

これにより、判定手段による判定では、取得手段によって取得された第1状態情報に基づき、記憶装置のコントローラと記憶装置の記憶媒体本体との接続の冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第2状態情報に基づき、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、請求項1記載の発明によれば、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。   Thereby, in the determination by the determination unit, is the state in which the redundancy of the connection between the controller of the storage device and the storage medium body of the storage device functions effectively based on the first state information acquired by the acquisition unit? A state in which the redundancy of the path between the computer of the computer system to be verified and the storage medium body of the storage device functions effectively based on the second state information acquired by the acquisition unit It is also determined whether or not the above is maintained. Therefore, according to the first aspect of the present invention, a computer system having a redundant portion including a storage device is in a state in which a serious failure is caused when a failure occurs because the redundancy does not function effectively. Can be detected.

なお、請求項1記載の発明において、検証対象のコンピュータ・システムが、コントローラと記憶媒体本体との接続の冗長化として、記憶装置に冗長化された複数のコントローラが設けられ、個々のコントーラに複数の媒体側アダプタが各々設けられ、複数のコントローラの各々毎に、個々の媒体側アダプタが、冗長化された複数の共有メモリのうちの互いに異なる共有メモリを経由して記憶媒体本体と接続された構成である場合、取得手段は、例えば請求項2に記載したように、コントローラに対し、複数のコントローラの各々と記憶装置の記憶媒体本体との間の接続経路を個々の媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、コントローラから前記情報を第1状態情報として取得するように構成することができる。   In the first aspect of the invention, the computer system to be verified is provided with a plurality of redundant controllers in the storage device as a redundant connection between the controller and the storage medium body, and a plurality of controllers are provided in each controller. Medium-side adapters are provided, and for each of the plurality of controllers, the individual medium-side adapters are connected to the storage medium body via different shared memories among the plurality of redundant shared memories. In the case of the configuration, for example, as described in claim 2, the acquisition unit represents, for each controller, a connection path between each of the plurality of controllers and the storage medium body of the storage device for each medium-side adapter. By transmitting a command for requesting information, the controller can be configured to acquire the information as first state information.

また、請求項1記載の発明において、検証対象のコンピュータ・システムが、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、記憶装置のコントローラに、複数のホストアダプタの何れかと接続される冗長化された複数のホスト側アダプタと、複数のホスト側アダプタの何れかと接続されると共に記憶装置の記憶媒体本体と接続され冗長化された複数の媒体側アダプタと、が各々設けられ、コンピュータ上で動作する所定のプログラムが、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎に経路及び稼働状態を管理する構成である場合、取得手段は、例えば請求項3に記載したように、所定のプログラムに対し、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、コントローラから前記情報を第2状態情報として取得するように構成することができる。   Further, in the first aspect of the present invention, a plurality of computer systems to be verified are made redundant to the computer as a path redundancy between the computer of the computer system to be verified and the storage medium body of the storage device. A plurality of redundant host-side adapters connected to any of the plurality of host adapters, and connected to any of the plurality of host-side adapters, and storage of the storage device A plurality of medium-side adapters connected to the medium body and made redundant, and a predetermined program operating on the computer is transferred from each host adapter of the computer system to be verified to the storage medium body of the storage device. In the case of a configuration that manages the route and the operating state for each individual path to reach, the acquisition means, for example, As described in claim 3, a predetermined program is requested for information indicating a path and an operating state for each path from the individual host adapter of the computer system to be verified to the storage medium body of the storage device. By transmitting a command, the information can be acquired from the controller as the second state information.

また、本願発明者による前述の検証作業の結果、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含むコンピュータ・システムにおいて、特に重大なシステム障害はコンピュータとネットワークとの通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。   In addition, as a result of the above-described verification work by the present inventor, in a computer system including a computer connected to a network via a network connection device, a particularly serious system failure is a system failure in which communication between the computer and the network is interrupted. Yes, if the above system failure is caused when a failure occurs because redundancy is not functioning effectively, the IP address assignment to the network connection device has been made redundant. In the state where the networking is not functioning effectively, and the assignment of a plurality of the network connection devices constituting the single network connection device virtually to the network adapter is made redundant. Is in a state that does not function effectively. It became apparent.

上記に基づき請求項4記載の発明に係る冗長状態検証装置は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。   Based on the above, the redundant state verification apparatus according to the invention described in claim 4 inquires the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device, Third state information indicating whether or not the assignment of the IP address to the network connection device is made redundant, and a plurality of network adapters of the network connection device that virtually configure a single network connection device Acquisition means for acquiring state information including fourth state information indicating whether or not the assignment to is redundant, storage means for storing the state information acquired by the acquisition means, and the acquisition means The status information acquired by the acquisition means in the past by the acquisition means By comparing with the state information stored in the storage means, it is determined whether or not the redundant portion of the computer system to be verified maintains a state in which the redundancy functions effectively Determination means.

請求項4記載の発明では、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。   According to the fourth aspect of the present invention, the IP address is assigned to the network connection device by inquiring about the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device. State information indicating whether or not a network is redundant, and a state in which assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant The state information including the fourth state information indicating whether or not is acquired by the acquisition unit, and the state information acquired by the acquisition unit is stored in the storage unit. The state information acquired by the acquisition unit is information indicating the current state of the redundant part of the computer system to be verified, and the determination unit stores the state information acquired by the acquisition unit in the past by the acquisition unit. Compared with the status information obtained and stored in the storage means, the redundant part of the computer system to be verified is in a state in which redundancy functions effectively (the active system has failed and is operating. When the system is stopped, it is determined whether or not the standby system is maintained in a state of switching to the operating state.

これにより、判定手段による判定では、取得手段によって取得された第3状態情報に基づき、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第4状態情報に基づき、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、請求項4記載の発明によれば、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。   Accordingly, in the determination by the determination unit, it is determined whether or not the state in which the redundancy of the IP address assignment to the network connection device is functioning effectively is maintained based on the third state information acquired by the acquisition unit. At the same time, based on the fourth state information acquired by the acquisition means, the state in which the redundancy of the assignment of the plurality of network connection devices constituting the single network connection device to the network adapter effectively functions effectively is maintained. It is also determined whether or not. Therefore, according to the fourth aspect of the present invention, a computer system including a computer connected to a network via a network connection device and having a redundant portion causes a failure because the redundancy does not function effectively. It is possible to detect that a serious failure is sometimes caused.

なお、請求項4記載の発明において、検証対象のコンピュータ・システムが、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられていると共に、複数のネットワーク接続デバイスの各々にIPアドレスが割り当てされる構成である場合、取得手段は、例えば請求項5に記載したように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々に割り当てられているIPアドレスを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第3状態情報として取得するように構成することができる。   In the invention according to claim 4, the computer system to be verified is provided with a plurality of network connection devices as redundant IP address assignment to the network connection devices, and each of the plurality of network connection devices is provided. In the configuration in which the IP address is assigned to each of the plurality of network connection devices, for example, the acquisition unit provides the operating system with information indicating the IP address assigned to each of the plurality of network connection devices. The information can be acquired from the operating system as the third state information by transmitting a command to be requested.

また、請求項4記載の発明において、検証対象のコンピュータ・システムが、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられ、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスが互いに異なるネットワークアダプタに割り当てされる構成である場合、取得手段は、例えば請求項6に記載したように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第4状態情報として取得するように構成することができる。   Further, in the invention described in claim 4, the computer system to be verified is configured such that the network connection device is configured as a redundant allocation of a plurality of network connection devices constituting a single network connection device virtually to a network adapter. In the case where a plurality of network connection devices that are virtually provided and constitute a single network connection device are assigned to different network adapters, the acquisition means may, for example, operate as described in claim 6 Sending a command requesting information indicating to which network adapter each of the plurality of network connection devices is assigned to the system to acquire the information as fourth state information from the operating system Ni It can be.

また、請求項1又は請求項4記載の発明において、検証対象のコンピュータ・システムが、クラスタを構成するコンピュータの冗長化として、単一のクラスタが複数台のコンピュータで構成された構成である場合、取得手段は、例えば請求項7に記載したように、オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、オペレーティング・システムから、前記情報を、検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得するように構成することが好ましい。   Further, in the invention according to claim 1 or claim 4, when the computer system to be verified has a configuration in which a single cluster is composed of a plurality of computers as redundancy of computers constituting the cluster, For example, as described in claim 7, the acquisition unit sends a command requesting the operating system to request information regarding the number of computers constituting the single cluster of the computer system to be verified and the operation status of each computer. By transmitting, the information is acquired from the operating system as fifth state information indicating whether or not a single cluster of the computer system to be verified is composed of a plurality of computers. It is preferable to configure.

本願発明者による前述の検証作業によれば、単一のクラスタが複数台のコンピュータで構成されることで冗長化されたコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系のコンピュータに障害が発生して稼働を停止すると、前記クラスタ自体が稼働停止状態となることで、大規模なシステム障害が引き起されることが判明している。これに対して請求項7記載の発明では、取得手段によって取得された第5状態情報に基づき、単一のクラスタを構成するコンピュータの冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、
単一のクラスタを複数台のコンピュータで構成する冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
According to the above-described verification work by the inventor of the present application, in a computer system made redundant by configuring a single cluster with a plurality of computers, the redundancy is not functioning effectively. In addition, it has been found that when a failure occurs in the active computer and the operation is stopped, the cluster itself is brought into an operation stop state, thereby causing a large-scale system failure. On the other hand, in the invention according to claim 7, it is also determined whether or not the redundancy of the computers constituting the single cluster is maintained effectively based on the fifth state information acquired by the acquiring means. Because it will be determined by means,
Detects that a redundant computer system consisting of multiple computers in a single cluster has entered a state in which a serious failure has occurred due to the failure of the redundancy. can do.

また、請求項1又は請求項4記載の発明において、検証対象のコンピュータ・システムが記憶装置を含んで構成され、検証対象のコンピュータ・システムのコンピュータと記憶装置との接続の冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成である場合、取得手段は、例えば請求項8に記載したように、コントローラに対し、複数のホストアダプタの各々が、複数のコントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数のホストアダプタのうち対を成すホストアダプタが複数のコントローラのうちの異なるコントローラに接続されている状態か否かを表す第6状態情報として取得するように構成することが好ましい。   Further, in the invention according to claim 1 or claim 4, the computer system to be verified includes a storage device, and as a redundant connection between the computer of the computer system to be verified and the storage device, When a plurality of redundant host adapters are provided, and the paired host adapters are connected to different controllers among the redundant controllers provided in the storage device. For example, as described in claim 8, the acquisition unit transmits a command requesting information indicating which of the plurality of host adapters is connected to each of the plurality of host adapters to the controller. The information is obtained from a plurality of host adapters that form a pair of host adapters. It is preferably configured to obtain a sixth state information indicating whether the state of being connected to different controllers.

本願発明者による前述の検証作業によれば、記憶装置を含んで構成されコンピュータと記憶装置との接続が冗長化された構成、すなわち、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成のコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系の接続に障害が発生すると、コンピュータと記憶装置との通信が途絶する大規模なシステム障害が引き起されることが明らかになっている。これに対して請求項8記載の発明では、取得手段によって取得された第6状態情報に基づき、コンピュータと記憶装置との接続の冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、コンピュータと記憶装置との接続が冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。   According to the above-described verification work by the inventor of the present application, a configuration in which a storage device is included and the connection between the computer and the storage device is made redundant, that is, the computer is provided with a plurality of redundant host adapters, A state in which the redundancy does not function effectively in a computer system having a configuration in which a pair of host adapters are connected to different controllers among a plurality of redundant controllers provided in the storage device. Even in such a case, it has become clear that when a failure occurs in the connection of the active system, a large-scale system failure that causes the communication between the computer and the storage device to be interrupted is caused. On the other hand, in the invention described in claim 8, based on the sixth state information acquired by the acquisition means, it is also determined whether or not the state in which the redundancy of the connection between the computer and the storage device functions effectively is maintained. Therefore, the computer system in which the connection between the computer and the storage device is made redundant is in a state where a serious failure is caused when a failure occurs because the redundancy does not function effectively. It can be detected.

また、請求項1〜請求項8の何れかに記載の発明において、例えば請求項9に記載したように、判定手段により、検証対象のコンピュータの冗長化された部分が、冗長化が有効に機能する状態を維持していないと判定された場合に、取得手段によって取得された状態情報が表す冗長化部分の現在の状態を通知する情報を出力する出力手段を更に設けることが好ましい。これにより、管理者等の利用者は、検証対象のコンピュータのうち冗長化が有効に機能する状態を維持していないと判定された部分が現在はどのような状態かを容易に把握することができ、冗長化が有効に機能する状態へ回復させるための対策を容易に講ずることができる。   Further, in the invention according to any one of claims 1 to 8, for example, as described in claim 9, the redundancy portion of the computer to be verified functions effectively by the determination means. When it is determined that the state to be maintained is not maintained, it is preferable to further provide output means for outputting information for notifying the current state of the redundant portion represented by the state information acquired by the acquisition means. As a result, a user such as an administrator can easily grasp the current state of the portion of the computer to be verified that is determined not to maintain a state in which redundancy is functioning effectively. Therefore, it is possible to easily take measures for recovering to a state where redundancy is effectively functioning.

請求項10記載の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。   The redundant state verification program according to the invention described in claim 10 constitutes a computer system to be verified including a storage device, or is connected to the computer system to be verified and includes a storage means. By inquiring about the state of the redundant part in the target computer system, it is determined whether the connection between the controller provided in the storage device and the storage medium body of the storage device is in a redundant state. 1 state information and state information including second state information indicating whether or not the path between the computer of the computer system to be verified and the storage medium body of the storage device is made redundant And the status information acquired by the acquisition unit is acquired in the past by the acquisition unit. By comparing with the state information stored in the storage means, it is determined whether or not the redundant portion of the computer system to be verified maintains a state in which the redundancy functions effectively It functions as a determination means.

請求項10記載の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが請求項10記載の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが請求項1に記載の冗長状態検証装置として機能することになり、請求項1記載の発明と同様に、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。   According to a tenth aspect of the present invention, there is provided a redundant state verification program that configures a computer system to be verified that includes a storage device or is connected to the computer system to be verified and includes a computer having storage means. And the computer executes the redundant state verification program according to the invention described in claim 10, so that the computer executes the redundant state verification program according to claim 10. As in the first aspect of the invention, a computer system having a redundant portion including a storage device has a serious failure when a failure occurs because the redundancy does not function effectively. It is possible to detect that the state has been raised.

請求項11記載の発明に係る冗長状態検証プログラムは、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。   The redundant state verification program according to the invention described in claim 11 constitutes a computer system to be verified including a computer connected to a network via a network connection device or is connected to the computer system to be verified, The computer having the storage means is inquired about the current state of the redundant portion in the computer system to be verified, thereby indicating whether or not the assignment of the IP address to the network connection device is made redundant. State including third state information and fourth state information indicating whether the assignment of a plurality of network connection devices constituting a single network connection device to a network adapter is made redundant. Acquisition means for acquiring information, and the acquisition means; By comparing the status information acquired in this way with the status information acquired in the past by the acquisition means and stored in the storage means, the redundant portion of the computer system to be verified is , And functioning as a determination means for determining whether or not the redundancy is maintained in a functioning state.

請求項11記載の発明に係る冗長状態検証プログラムは、複数のネットワークアダプタポートを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが請求項11記載の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが請求項4に記載の冗長状態検証装置として機能することになり、請求項4記載の発明と同様に、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。   The redundant state verification program according to the invention of claim 11 constitutes a computer system to be verified including a computer connected to a network via a plurality of network adapter ports, or is connected to the computer system to be verified. Since the computer having the storage unit functions as the acquisition unit and the determination unit, the computer executes the redundancy state verification program according to the invention described in claim 11, thereby The computer functions as the redundant state verification device according to claim 4, and has a redundant portion including the computer connected to the network via the network connection device as in the invention according to claim 4. The computer system functions effectively with the above redundancy It is possible to detect that a serious failure in a state that is caused in the event of a failure by the absence.

以上説明したように本発明は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置のコントローラと記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、コンピュータと記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。   As described above, the present invention makes the connection between the controller of the storage device and the storage medium main body redundant by inquiring about the state of the redundant portion in the computer system to be verified including the storage device. First state information indicating whether or not, and state information including second state information indicating whether or not the path between the computer and the storage medium body is redundant, and the acquired state information Is compared with the state information acquired in the past to determine whether the redundant portion of the computer system maintains a state in which the redundancy functioning effectively. The computer system having a part can detect that a serious failure is caused when a failure occurs because the redundancy does not function effectively. It was having an effect.

また本発明は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。   In addition, the present invention makes it possible to make redundant assignment of IP addresses to network connection devices by inquiring about the current state of the redundancy part in a computer system to be verified including a computer connected to a network via a network connection device. Third state information indicating whether or not the network is connected, and whether or not the assignment of a plurality of network connection devices constituting a single network connection device to the network adapter is made redundant The state information including the fourth state information is obtained, and the obtained state information is compared with the state information obtained in the past, so that the redundant part of the computer system To determine whether or not the network is connected via the network connection device. The computer system having a redundant part including a connected computer can detect that a serious failure is caused when a failure occurs because the redundancy does not function effectively. It has the effect.

本実施形態に係るコンピュータ・システムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the computer system which concerns on this embodiment. 検証対象のコンピュータ・システムとしてのウェブサービス提供システムの概略構成を示すブロック図である。It is a block diagram which shows schematic structure of the web service provision system as a computer system of a verification object. 冗長化構成検証処理の内容を示すフローチャートである。It is a flowchart which shows the content of the redundancy structure verification process. 端末装置のディスプレイに表示される画面の一例を示すイメージ図である。It is an image figure which shows an example of the screen displayed on the display of a terminal device.

以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係るコンピュータ・システム10が示されている。コンピュータ・システム10は、検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を備え、このウェブサービス提供システム12がイントラネットから成るネットワーク14を介し、管理装置として使用される端末装置16に接続されて構成されている。   Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a computer system 10 according to the present embodiment. The computer system 10 includes a web service providing system 12 as a computer system to be verified, and the web service providing system 12 is connected to a terminal device 16 used as a management device via a network 14 including an intranet. It is configured.

端末装置16はPC(Personal Computer)等から成り、CPU16A、ROMやRAM等を含むメモリ16C、HDD(Hard Disk Drive)やフラッシュメモリ等から成る不揮発性の記憶部16C、通信I/F(インタフェース)部16Dを備え、通信I/F部16Dがネットワーク14に接続されている。記憶部16CにはOS(Operating System)のプログラム(図示省略)やブラウザ(ウェブ閲覧ソフト)のプログラムが各々イントールされている。また端末装置16には、LCD等から成るディスプレイ18、マウス20及びキーボード22が各々接続されている。   The terminal device 16 includes a PC (Personal Computer) and the like, and includes a CPU 16A, a memory 16C including a ROM and a RAM, a nonvolatile storage unit 16C including a HDD (Hard Disk Drive) and a flash memory, and a communication I / F (interface). The communication I / F unit 16D is connected to the network 14. The storage unit 16C is installed with an OS (Operating System) program (not shown) and a browser (web browsing software) program. The terminal device 16 is connected to a display 18 such as an LCD, a mouse 20 and a keyboard 22.

一方、ウェブサービス提供システム12は、ネットワーク(このネットワークはネットワーク14でもよいし、インターネット等の他のネットワークであってもよい)経由で利用者に所定のウェブサービスを提供するコンピュータ・システムであり、2台のDB(DataBase)サーバ26,28と、2台のAP(APplication)サーバ30,32と、を含んで構成されている。個々のサーバ26〜32はCPU34、ROMやRAM等を含むメモリ36、不揮発性の記憶部38、通信I/F部40を備え、通信I/F部40がネットワーク14に接続され、記憶部38にはOS(Operating System)のプログラム(図示省略)や冗長化構成検証プログラム、パス管理ソフトのプログラムが各々イントールされている。冗長化構成検証プログラム及びパス管理ソフトのプログラムは、各サーバ26〜32の起動時に記憶部38から読み出されてメモリ36に各々記憶され、パス管理ソフトのプログラムはCPU34によって常時実行され、冗長化構成検証プログラムは必要時(端末装置16からの指示時:詳細は後述)にCPU34によって実行される。なお、パス管理ソフトのプログラムは請求項3に記載の所定のプログラムの一例である。   On the other hand, the web service providing system 12 is a computer system that provides a predetermined web service to a user via a network (this network may be the network 14 or another network such as the Internet). The system includes two DB (DataBase) servers 26 and 28 and two AP (APplication) servers 30 and 32. Each of the servers 26 to 32 includes a CPU 34, a memory 36 including a ROM and a RAM, a nonvolatile storage unit 38, and a communication I / F unit 40. The communication I / F unit 40 is connected to the network 14, and the storage unit 38. OS (Operating System) program (not shown), redundant configuration verification program, and path management software program are respectively installed. The redundancy configuration verification program and the path management software program are read from the storage unit 38 when the servers 26 to 32 are started up and stored in the memory 36, respectively. The path management software program is always executed by the CPU 34, and is made redundant. The configuration verification program is executed by the CPU 34 when necessary (when instructed from the terminal device 16; details will be described later). The path management software program is an example of a predetermined program according to claim 3.

なお、冗長化構成検証プログラムは本発明に係る冗長状態検証プログラムの一例であり、各サーバ26〜32はCPU34によって冗長化構成検証プログラムが実行されることで、本発明に係る冗長状態検証装置として機能する。また、詳細は後述するが、各サーバ26〜32の記憶部38は、実際には後述するディスク装置56(の論理ディスク)によって構成され、各サーバ26〜32の通信I/F部40は実際には後述するネットワークアダプタ52A,52B及びネットワーク接続デバイス54A,54Bによって構成される。   The redundant configuration verification program is an example of the redundant state verification program according to the present invention, and each of the servers 26 to 32 is executed by the CPU 34 as the redundant configuration verification program. Function. Although details will be described later, the storage unit 38 of each server 26 to 32 is actually constituted by a disk device 56 (logical disk) described later, and the communication I / F unit 40 of each server 26 to 32 is actually used. The network adapters 52A and 52B and network connection devices 54A and 54B, which will be described later.

ウェブサービス提供システム12は、安定稼働に対する要求水準の高いコンピュータ・システムであり、各部分が冗長化されている。すなわち、ウェブサービス提供システム12では、DBサーバが冗長化され、DBサーバ26,28が単一のクラスタを構成しており、DBサーバ26は通常時に稼働する現用系、 DBサーバ28は障害の発生によりDBサーバ26が稼働を停止した場合に稼働が開始される待機系とされている。また、APサーバも冗長化され、APサーバ30,32が単一のクラスタを構成しており、APサーバ30は通常時に稼働する現用系、APサーバ32は障害の発生によりAPサーバ30が稼働を停止した場合に稼働が開始される待機系とされている。   The web service providing system 12 is a computer system having a high level of demand for stable operation, and each part is made redundant. That is, in the web service providing system 12, the DB server is made redundant, the DB servers 26 and 28 constitute a single cluster, the DB server 26 is the active system that operates normally, and the DB server 28 has a failure. Therefore, when the DB server 26 stops operating, the standby system is started. In addition, the AP server is also made redundant, and the AP servers 30 and 32 constitute a single cluster. The AP server 30 is active during normal operation, and the AP server 32 is activated when a failure occurs. It is a standby system that starts operation when it stops.

一方、図2に示すように、DBサーバ26及びAPサーバ30はサーバシャーシ42に搭載され、DBサーバ28及びAPサーバ32はサーバシャーシ44に搭載されており、DBサーバ26及びAPサーバ30には、サーバシャーシ42に搭載された電源部(図示省略)から電力が供給され、DBサーバ28及びAPサーバ32には、サーバシャーシ44に搭載された電源部(図示省略)から電力が供給される。   On the other hand, as shown in FIG. 2, the DB server 26 and the AP server 30 are mounted on the server chassis 42, and the DB server 28 and the AP server 32 are mounted on the server chassis 44, and the DB server 26 and the AP server 30 include Power is supplied from a power supply unit (not shown) mounted on the server chassis 42, and power is supplied to the DB server 28 and the AP server 32 from a power supply unit (not shown) mounted on the server chassis 44.

また、サーバシャーシ42には2個のIOAモジュール46,48が搭載されている。IOAモジュール46,48には、DBサーバ26を光ファイバ経由でディスク装置56と接続するためのHBA(Host Bus Adapter)50Aと、APサーバ30を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ26をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ30をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ26及びAPサーバ30はIOAモジュール46,48に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。なお、HBA50A,50Bは請求項3,8に記載のホストアダプタの一例である。   In addition, two IOA modules 46 and 48 are mounted on the server chassis 42. The IOA modules 46 and 48 include an HBA (Host Bus Adapter) 50A for connecting the DB server 26 to the disk device 56 via an optical fiber, and an HBA 50B for connecting the AP server 30 to the disk device 56 via an optical fiber. A network adapter (network connection card) 52A for connecting the DB server 26 to the network 14, and a network adapter (network connection card) 52B for connecting the AP server 30 to the network 14. The DB server 26 and the AP server 30 are connected to the IOA modules 46 and 48, respectively. In addition, two network connection devices (network connection boards) 54A and 54B are attached to the individual network adapters 52A and 52B. The HBAs 50A and 50B are examples of the host adapter according to claims 3 and 8.

また、サーバシャーシ44には2個のIOAモジュール56,58が搭載されている。IOAモジュール56,58には、DBサーバ28を光ファイバ経由でディスク装置56と接続するためのHBA50Aと、APサーバ32を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ28をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ32をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ28及びAPサーバ32はIOAモジュール56,58に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。   In addition, two IOA modules 56 and 58 are mounted on the server chassis 44. The IOA modules 56 and 58 include an HBA 50A for connecting the DB server 28 to the disk device 56 via an optical fiber, an HBA 50B for connecting the AP server 32 to the disk device 56 via an optical fiber, and the DB server 28. A network adapter (network connection card) 52A for connecting to the network 14 and a network adapter (network connection card) 52B for connecting the AP server 32 to the network 14 are provided, respectively. The server 32 is connected to the IOA modules 56 and 58, respectively. In addition, two network connection devices (network connection boards) 54A and 54B are attached to the individual network adapters 52A and 52B.

本実施形態に係るウェブサービス提供システム12では、ネットワーク接続デバイス54A,54BへのIPアドレスの割り当ての冗長化として、IOAモジュール46,48,56,58に設けられた全てのネットワーク接続デバイス54A,54BにIPアドレスが割り当てされる。   In the web service providing system 12 according to the present embodiment, all the network connection devices 54A, 54B provided in the IOA modules 46, 48, 56, 58 are provided as redundancy of IP address assignment to the network connection devices 54A, 54B. Is assigned an IP address.

また、本実施形態では、各サーバ26〜32とネットワーク14との接続の冗長化として、サーバ1台当りネットワーク接続デバイス54が合計4個設けられ、2個1組のネットワーク接続デバイス54により、一方のネットワーク接続デバイス54を現用系、他方のネットワーク接続デバイス54を待機系とする単一の仮想的なネットワーク接続デバイスが構成され(ボンディング(bonding)という)、2個1組のネットワーク接続デバイス54から成る仮想的なネットワーク接続デバイスがサーバ1台当り2組設けられており、更に、単一の仮想的なネットワーク接続デバイスを構成する2個のネットワーク接続デバイス54として、異なるネットワークアダプタ52に取付けられたネットワーク接続デバイス54を用いている。   In the present embodiment, as a redundant connection between the servers 26 to 32 and the network 14, a total of four network connection devices 54 are provided for each server. A single virtual network connection device is constructed (referred to as bonding) with the other network connection device 54 as the active system and the other network connection device 54 as the standby system. Two sets of virtual network connection devices are provided for each server, and two network connection devices 54 constituting a single virtual network connection device are attached to different network adapters 52. A network connection device 54 is used.

例えばDBサーバ28については、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、によって単一の仮想的なネットワーク接続デバイスが構成されると共に、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、によって単一の仮想的なネットワーク接続デバイスが構成されている。   For example, with respect to the DB server 28, a single virtual connection is made by a network connection device 54A attached to the network adapter 52A of the IOA module 46 and a network connection device 54A attached to the network adapter 52A of the IOA module 48. The network connection device 54B is attached to the network adapter 52A of the IOA module 48 and the network connection device 54B is attached to the network adapter 52A of the IOA module 48. A typical network connection device is configured.

一方、ディスク装置56は、ディスク駆動装置(DKU)58によって駆動される多数台のディスクドライブを備えている。多数台のディスクドライブは、各々冗長化された複数の論理ディスクを形成するように互いに接続されている。また、ディスク装置56にはディスク制御装置(DKC)60が設けられている。ディスク制御装置(DKC)60には冗長化された2個のクラスタ62A,62Bが設けられており、クラスタ62A,62Bの一方が現用系、他方が待機系とされている。個々のクラスタ62A,62Bには、各々複数個のチャネル・アダプタ(CHA)64が設けられたチャネル・アダプタ群66,68と、複数個のディスク・アダプタ(DKA)70が設けられたディスク・アダプタ群72と、チャネル・アダプタ群66,68の個々のチャネル・アダプタ(CHA)64とディスク・アダプタ群72の個々のディスク・アダプタ(DKA)70を接続するキャッシュ・スイッチ(CSW)74が各々設けられている。また、ディスク装置56には冗長化された一対の共有メモリ76A,76Bが設けられている。   On the other hand, the disk device 56 includes a large number of disk drives driven by a disk drive unit (DKU) 58. A large number of disk drives are connected to each other so as to form a plurality of redundant logical disks. The disk device 56 is provided with a disk controller (DKC) 60. The disk controller (DKC) 60 is provided with two redundant clusters 62A and 62B, one of the clusters 62A and 62B being the active system and the other being the standby system. Each cluster 62A, 62B has a channel adapter group 66, 68 provided with a plurality of channel adapters (CHA) 64, and a disk adapter provided with a plurality of disk adapters (DKAs) 70, respectively. A cache switch (CSW) 74 for connecting the group 72, the individual channel adapter (CHA) 64 of the channel adapter group 66, 68 and the individual disk adapter (DKA) 70 of the disk adapter group 72 is provided. It has been. The disk device 56 is provided with a pair of redundant shared memories 76A and 76B.

ディスクドライブの個々の論理ディスクはクラスタ62A,62Bの何れか1つのディスク・アダプタ(DKA)70に各々接続されているが、本実施形態ではディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクは、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されている。   Each logical disk of the disk drive is connected to each one of the cluster adapters (DKA) 70 of the clusters 62A and 62B. In this embodiment, the disk controller (DKC) 60 and the disk drive (logical disk) are connected. Each logical disk is connected to any one disk adapter (DKA) 70 of the cluster 62A via the shared memory 76A, while any one disk of the cluster 62B is connected. The adapter (DKA) 70 is connected via the shared memory 76B.

また、個々のHBA50A,50Bは光ファイバケーブル78を介して何れかのチャネル・アダプタ(CHA)64と接続されているが、本実施形態では各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続するHBA50が冗長化されて2個設けられており(一方が現用系で他方が待機系)、当該2個のHBA50は互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されている。例えば、DBサーバ26をディスク装置56と接続する2個のHBA50Aのうち、IOAモジュール46に設けられたHBA50Aはクラスタ62Aのチャネル・アダプタ(CHA)64と接続されている一方、IOAモジュール48に設けられたHBA50Aはクラスタ62Bのチャネル・アダプタ(CHA)64と接続されている。   Each HBA 50A, 50B is connected to one of the channel adapters (CHA) 64 via an optical fiber cable 78. In this embodiment, each server 26 to 32 and the disk device 56 (disk controller ( DKC) 60) for redundancy of connection, two HBAs 50 that connect a single server to the disk device 56 are made redundant (one is the active system and the other is the standby system). The HBAs 50 are connected to channel adapters (CHAs) 64 of different clusters 62. For example, of the two HBAs 50A that connect the DB server 26 to the disk device 56, the HBA 50A provided in the IOA module 46 is connected to the channel adapter (CHA) 64 of the cluster 62A, while provided in the IOA module 48. The HBA 50A thus connected is connected to the channel adapter (CHA) 64 of the cluster 62B.

なお、ディスク制御装置(DKC)60は請求項1〜3,8に記載のコントローラの一例であり、クラスタ62A,62Bは請求項2,8に記載の複数のコントローラの一例であり、ディスク・アダプタ(DKA)70は請求項2,3に記載の媒体側アダプタの一例であり、チャネル・アダプタ(CHA)64は請求項3に記載のホスト側アダプタの一例である。   The disk controller (DKC) 60 is an example of a controller according to claims 1 to 3 and 8, and the clusters 62A and 62B are examples of a plurality of controllers according to claims 2 and 8, and a disk adapter. (DKA) 70 is an example of a medium-side adapter according to claims 2 and 3, and channel adapter (CHA) 64 is an example of a host-side adapter according to claim 3.

次に本実施形態の作用を説明として、ウェブサービス提供システム12を含むコンピュータ・システム10の管理者が、端末装置16からウェブサービス提供システム12の各サーバ26〜32に対して冗長化構成の検証を各々指示したことを契機として、各サーバ26〜32のCPU34で冗長化構成検証プログラムが実行されることによって実現される冗長化構成検証処理について、図3を参照して説明する。   Next, as an explanation of the operation of the present embodiment, the administrator of the computer system 10 including the web service providing system 12 verifies the redundant configuration from the terminal device 16 to each of the servers 26 to 32 of the web service providing system 12. Referring to FIG. 3, the redundant configuration verification processing realized by executing the redundant configuration verification program by the CPU 34 of each of the servers 26 to 32 will be described.

なお、管理者はウェブサービス提供システム12の構築が完了してウェブサービス提供システム12の稼働が開始される際に、マスタとして用いる状態情報の取得(後述)を目的として冗長化構成の検証を一度指示し、その後、例えばウェブサービス提供システム12を構成する一部のハードウェアの交換や一部の設定の変更、各サーバ26〜32にインストールされているプログラムのバージョンアップ等のように、ウェブサービス提供システム12の環境や一部構成が変更される度に、ウェブサービス提供システム12の冗長化部分が冗長化が有効に機能する状態を維持しているか否かを確認することを目的として、冗長化構成の検証を指示する。そして、各サーバ26〜32では、冗長化構成の検証が指示される都度、以下で説明する冗長化構成検証処理が行われる。   When the administrator completes the construction of the web service providing system 12 and starts the operation of the web service providing system 12, the administrator once verifies the redundant configuration for the purpose of obtaining state information used as a master (described later). Web services such as replacement of part of hardware constituting the web service providing system 12, change of some settings, version upgrade of programs installed in the servers 26 to 32, etc. Each time the environment or part of the configuration of the providing system 12 is changed, the redundant portion of the web service providing system 12 is redundant for the purpose of confirming whether or not the redundancy is functioning effectively. Instructs verification of the configuration. Each time the servers 26 to 32 are instructed to verify the redundant configuration, the redundant configuration verification processing described below is performed.

冗長化構成検証処理では、まずステップ100において、冗長化構成検証処理を前回実行した際に取得した状態情報を記憶部38の所定領域から削除する。なお、冗長化構成検証処理を最初に実行する際には、記憶部38の所定領域に状態情報が記憶されていないので、上記のステップ100の実行は省略される。次のステップ102では、自サーバ上で稼働しているOSに対し、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す情報を要求する所定のコマンドを送信する。   In the redundant configuration verification process, first, in step 100, the state information acquired when the redundant configuration verification process was executed last time is deleted from a predetermined area of the storage unit 38. When the redundant configuration verification process is executed for the first time, since the state information is not stored in the predetermined area of the storage unit 38, the execution of the above step 100 is omitted. In the next step 102, with respect to the OS running on the local server, the number of servers constituting the cluster to which the local server belongs and the operating state (for example, “active” / “standby” / “stopped”). A predetermined command for requesting information indicating any one of the above.

OSは自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を保持しており、前記コマンドを受信すると自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を読み出し、自サーバと同一のクラスタを構成している他のサーバの稼働状態については、読み出した情報に含まれる前記他のサーバの識別情報に基づき前記他のサーバ上で稼働しているOSに対して稼働状態を問い合わせ、例えば応答が無ければ前記他のサーバの稼働状態を「停止中」と判断し、応答を受信した場合は当該応答により通知された稼働状態に従って前記他のサーバの稼働状態を「稼働中」又は「待機中」と判断する。そしてOSは、判断した他のサーバの稼働状態を含む、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態を表す情報を、冗長化構成検証プログラムへ引き渡す処理を行う。   The OS holds information indicating the number of servers constituting the cluster to which the server belongs and identification information. When the OS receives the command, the OS represents the number of servers constituting the cluster to which the server belongs and identification information. As for the operating status of other servers that read the information and constitute the same cluster as the own server, the OS running on the other server based on the identification information of the other server included in the read information For example, if there is no response, the operation status of the other server is determined as “stopped”. If a response is received, the operation of the other server is performed according to the operation status notified by the response. The status is determined as “in operation” or “standby”. Then, the OS performs processing for handing over the information indicating the number of servers constituting the cluster to which the server belongs and the operating status including the determined operating status of the other server to the redundancy configuration verification program.

冗長化構成検証処理では、上記情報がOSから引き渡されるとステップ104へ移行し、まず、引き渡された情報の中に実行の都度内容が相違する情報(例えば現在の日付や時刻等)が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、引き渡された情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項7に記載の第5状態情報の一例であり、ステップ102,104は請求項7に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above information is delivered from the OS, the process proceeds to step 104. First, the delivered information includes information (for example, the current date and time) whose contents differ every time it is executed. If the relevant information is included, the relevant information is deleted, and then the delivered information is stored in the memory 36 as state information. Here, the information stored as the state information is an example of the fifth state information described in claim 7, and steps 102 and 104 are an example of the processing by the acquisition means described in claim 7.

次のステップ106では、ディスク装置56のディスク制御装置(DKC)60に対し、自サーバに対応する2個のHBA50が光ファイバケーブル78を介して接続されているクラスタ62がクラスタ62A,62Bの何れであるかを表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bに設けられた個々のチャネル・アダプタ(CHA)64が何れのHBA50と接続されているかを表す情報を保持・管理しており、上記コマンドを受信すると、コマンド送信元のサーバに対応する2個のHBA50が何れのクラスタ62の何れのチャネル・アダプタ(CHA)64と接続されているかを表す情報を前記情報から抽出し、抽出した情報をコマンド送信元のサーバへ送信する。   In the next step 106, the cluster 62 in which the two HBAs 50 corresponding to the own server are connected to the disk control unit (DKC) 60 of the disk unit 56 via the optical fiber cable 78 is selected from the clusters 62A and 62B. A predetermined command requesting information indicating whether or not is transmitted. The disk controller (DKC) 60 holds and manages information indicating to which HBA 50 each channel adapter (CHA) 64 provided in the clusters 62A and 62B is connected, and receives the above command. Then, information indicating which channel adapter (CHA) 64 of which cluster 62 is connected to the two HBAs 50 corresponding to the command transmission source server is extracted from the information, and the extracted information is transmitted to the command. Send to the original server.

冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ108へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項8に記載の第6状態情報の一例であり、ステップ106,108は請求項8に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above information is received from the disk controller (DKC) 60, the process proceeds to step 108, and it is searched whether or not the received information includes information that differs in content every time it is executed. If the corresponding information is included, the corresponding information is deleted, and the received information is stored in the memory 36 as status information. Here, the information stored as the state information is an example of sixth state information described in claim 8, and steps 106 and 108 are an example of processing by the acquisition means described in claim 8.

続いてステップ110では、ディスク装置56のディスク制御装置(DKC)60に対し、クラスタ62A,62Bとディスク装置56の論理ディスクとの接続経路を、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bとディスク装置56の論理ディスクとが共有メモリ76A,76Bの何れを経由して接続されているかを、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を保持・管理しており、上記コマンドを受信すると上記情報をコマンド送信元のサーバへ送信する。   Subsequently, in step 110, the individual disk adapters provided in the clusters 62A and 62B are connected to the disk control unit (DKC) 60 of the disk unit 56 by connecting the connection paths between the clusters 62A and 62B and the logical disks of the disk unit 56. (DKA) A predetermined command for requesting information represented for each 70 is transmitted. The disk controller (DKC) 60 determines whether each of the clusters 62A and 62B is connected to the logical disks of the clusters 62A and 62B via the shared memories 76A and 76B. Information held for each adapter (DKA) 70 is held and managed, and when the command is received, the information is transmitted to the server that sent the command.

冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ112へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項1,2に記載の第1状態情報の一例であり、ステップ110,112は請求項1,2に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above information is received from the disk controller (DKC) 60, the process proceeds to step 112, and it is searched whether or not the received information includes information that differs in content every time it is executed. If the corresponding information is included, the received information is stored in the memory 36 as state information after being deleted. Here, the information stored as the state information is an example of the first state information described in claims 1 and 2, and steps 110 and 112 are an example of the processing by the acquisition means described in claims 1 and 2. .

次のステップ114では、自サーバ上で稼働しているパス管理ソフトに対し、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路及び稼働状態を管理する管理情報を要求する所定のコマンドを送信する。パス管理ソフトは、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路(HBA50とチャネル・アダプタ(CHA)64の間、及び、ディスク・アダプタ(DKA)70と論理ディスクの間の各経路が重複していないか否か)及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す管理情報を保持・管理しており、上記コマンドを受信すると上記の管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。   In the next step 114, for the path management software running on the local server, the path and operating status of the two paths from the two HBAs 50 corresponding to the local server to the logical disk of the disk unit 56 are displayed. A predetermined command for requesting management information to be managed is transmitted. The path management software, for the two paths from the two HBAs 50 corresponding to its own server to the logical disk of the disk device 56, the path (between the HBA 50 and the channel adapter (CHA) 64 and the disk adapter ( DKA) Management information indicating whether each path between the 70 and the logical disk is not duplicated) and an operating state (for example, “in operation” / “standby” / “stopped”) When the command is received, the management information is transferred to the redundant configuration verification program.

冗長化構成検証処理では、上記の管理情報がパス管理ソフトから引き渡されるとステップ116へ移行し、引き渡された管理情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、引き渡された管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項1,3に記載の第2状態情報の一例であり、ステップ114,116は請求項1,3に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above management information is delivered from the path management software, the process proceeds to step 116, and it is searched whether or not the delivered management information includes information that differs in content every time it is executed. If the corresponding information is included, it is deleted, and the transferred management information is stored in the memory 36 as status information. Here, the information stored as the state information is an example of the second state information described in claims 1 and 3, and steps 114 and 116 are an example of the processing by the acquisition means described in claims 1 and 3. .

続いてステップ118では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54に割り当てられているIPアドレスの通知を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々に割り当てられているIPアドレスをIPアドレス管理情報として保持・管理しており、上記コマンドを受信すると、上記のIPアドレス管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。   In step 118, a command requesting notification of IP addresses assigned to the four network connection devices 54 corresponding to the server is transmitted to the OS running on the server. The OS holds and manages the IP address assigned to each of all the network connection devices 54 corresponding to the server as IP address management information, and when the command is received, the IP address management information is made redundant. Performs processing to pass to the configuration verification program.

冗長化構成検証処理では、上記のIPアドレス管理情報がOSから引き渡されるとステップ120へ移行し、引き渡されたIPアドレス管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡されたIPアドレス管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項4,5に記載の第3状態情報の一例であり、ステップ118,120は請求項4,5に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above IP address management information is delivered from the OS, the process proceeds to step 120. If the delivered IP address management information includes information whose contents differ every time it is executed, After the information is deleted, the delivered IP address management information is stored in the memory 36 as status information. Here, the information stored as the status information is an example of the third status information described in claims 4 and 5, and steps 118 and 120 are an example of the processing by the acquisition means described in claims 4 and 5. .

次のステップ122では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54が、各々何れのネットワークアダプタ52に割り当てられているかを表す情報を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々が割り当てられているネットワークアダプタ52を表す割当管理情報を保持・管理しており、上記コマンドを受信すると、上記の割当管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。   In the next step 122, a command for requesting information indicating which network adapter 52 each of the four network connection devices 54 corresponding to the own server is assigned to the OS running on the own server. Send. The OS holds and manages allocation management information representing the network adapter 52 to which each of the network connection devices 54 corresponding to the server itself is allocated. When the OS receives the command, the OS makes the allocation management information redundant. Performs processing to pass to the configuration verification program.

冗長化構成検証処理では、上記の割当管理情報がOSから引き渡されるとステップ124へ移行し、引き渡された割当管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡された割当管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項4,6に記載の第4状態情報の一例であり、ステップ118,120は請求項4,6に記載の取得手段による処理の一例である。   In the redundant configuration verification process, when the above allocation management information is delivered from the OS, the process proceeds to step 124, and if the delivered allocation management information includes information whose contents differ every time it is executed, the information is displayed. After the deletion, the transferred allocation management information is stored in the memory 36 as status information. Here, the information stored as the state information is an example of the fourth state information described in claims 4 and 6, and steps 118 and 120 are an example of the processing by the acquisition means described in claims 4 and 6. .

次のステップ126では、ウェブサービス提供システム12における冗長化された他の部分の状態を表す状態情報を、前記他の部分の状態を管理する管理部(例えばOSやディスク制御装置(DKC)60、パス管理ソフト等のプログラム)に要求し、前記管理部から状態情報を受信してメモリ36に記憶させる処理を行う。なお、このステップ126で取得される状態情報の一例については後述する。   In the next step 126, status information indicating the status of the other redundant part in the web service providing system 12 is converted into a management unit (for example, an OS or a disk controller (DKC) 60, which manages the status of the other part). A program such as a path management software), and receives status information from the management unit and stores it in the memory 36. An example of the state information acquired in step 126 will be described later.

次のステップ128では、今回の冗長化構成検証処理の実行が初回の実行(ウェブサービス提供システム12の稼働が開始される際の実行)か否か判定する。この判定は、記憶部38のうち状態情報のマスタを記憶するための所定の記憶領域に状態情報が記憶されているか否かを判定することで行うことができる。この判定が肯定された場合はステップ130へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、状態情報のマスタとして記憶部38の前記所定の記憶領域に記憶させ、冗長化構成検証処理を終了する。   In the next step 128, it is determined whether or not the current redundant configuration verification process is executed for the first time (execution when the operation of the web service providing system 12 is started). This determination can be made by determining whether or not the state information is stored in a predetermined storage area for storing the state information master in the storage unit 38. When this determination is affirmed, the process proceeds to step 130, and the state information stored in the memory 36 in step 102 to step 126 (the state information acquired in the current process) is stored in the storage unit 38 as the state information master. The data is stored in a predetermined storage area, and the redundant configuration verification process is terminated.

一方、ステップ128の判定が否定された場合はステップ132へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、その種別毎に、記憶部38の前記所定の記憶領域に記憶されている状態情報のマスタと比較し、マスタと不一致の状態情報があれば、その種別及び内容を抽出する。次のステップ134では管理者から指示された状態情報の出力対象を判定し、判定結果に応じてステップ136又はステップ138へ分岐する。   On the other hand, if the determination in step 128 is negative, the process proceeds to step 132, and the state information (the state information acquired in the current process) stored in the memory 36 in steps 102 to 126 is stored for each type. Compared with the master of the status information stored in the predetermined storage area of the unit 38, if there is status information that does not match the master, the type and content are extracted. In the next step 134, the output target of the status information instructed by the administrator is determined, and the process branches to step 136 or step 138 depending on the determination result.

本実施形態において、状態情報の出力対象としては、今回の状態情報とマスタとの「比較結果」と状態情報の「全内容」を選択可能とされており、管理者が端末装置16を介し出力対象として「比較結果」を選択した場合には、ステップ134からステップ136へ移行し、例として図4(A)に示すように、状態情報の各項目毎に、今回の状態情報とマスタとの比較結果が一致していれば「○」を、不一致であれば「×」を表示すると共に、マスタと不一致の項目についてはその内容も表示した比較結果表示画面を生成し、生成した比較結果表示画面のデータを端末装置16へ送信することで、図4(A)に示すような比較結果表示画面を端末装置16のディスプレイ18に表示させる。   In the present embodiment, as the output target of the state information, “comparison result” between the current state information and the master and “all contents” of the state information can be selected, and the administrator outputs via the terminal device 16. When “comparison result” is selected as the target, the process proceeds from step 134 to step 136. As shown in FIG. 4A as an example, for each item of the state information, the current state information and the master “○” is displayed if the comparison results match, “x” is displayed if they do not match, and a comparison result display screen that displays the contents of items that do not match the master is also generated, and the generated comparison result display By transmitting the screen data to the terminal device 16, a comparison result display screen as shown in FIG. 4A is displayed on the display 18 of the terminal device 16.

先に説明したように、ウェブサービス提供システム12では、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクが、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されているが、例えば論理ディスク又は共有メモリ76又はディスク・アダプタ(DKA)70(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態に陥る可能性がある。   As described above, in the web service providing system 12, as a redundant connection between the disk controller (DKC) 60 and the disk drive (logical disk), each logical disk is one of the disks in the cluster 62A. While connected to the adapter (DKA) 70 via the shared memory 76A, the disk adapter (DKA) 70 of any one of the clusters 62B is connected via the shared memory 76B. When the logical disk or shared memory 76 or the disk adapter (DKA) 70 (or cluster 62) is replaced, the disk controller (DKC) 60 and the disk drive (logical disk ) May not work effectively.

これに対して本実施形態では、上記の状態に陥ると、先のステップ112で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。   On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 112 becomes inconsistent with the state information of the master. Will be notified. The administrator performs an operation to restore the state in which the redundancy of the connection between the disk controller (DKC) 60 and the disk drive (logical disk) functions effectively, so that the disk controller can be used when a failure occurs. Since the redundancy of the connection between the (DKC) 60 and the disk drive (logical disk) is not functioning effectively, a serious system failure is prevented from occurring.

また、ウェブサービス提供システム12では、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化として、各サーバ毎に2個のHBA50が設けられ、2個のHBA50からディスク装置56の論理ディスクに至る2本のパスが設けられているが、例えば一方のパスの経路上に存在する機器で障害が発生した等の場合、2本のパスの経路の一部が重複していたり、一方のパスの状態が「停止中」になっていたり等のように、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態に陥る可能性がある。   Further, in the web service providing system 12, two HBAs 50 are provided for each server as a redundant path from each of the servers 26 to 32 to the logical disk of the disk device 56. There are two paths to the logical disk. However, for example, when a failure occurs in a device on the path of one path, some of the paths of the two paths overlap. There is a possibility that the redundancy of the path from each of the servers 26 to 32 to the logical disk of the disk device 56 does not function effectively, such as the state of one path is “stopped”. is there.

これに対して本実施形態では、上記の状態に陥ると、先のステップ116で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。   On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the previous step 116 does not match the state information of the master, so that it is detected that the state has fallen into the above state, and the administrator Will be notified. Then, the administrator performs an operation of restoring the path from the corresponding server to the logical disk of the disk device 56 to a state in which redundancy of the function is effectively functioning, so that any of the servers 26 to 32 is detected when a failure occurs. Since the redundancy of the path from the disk device 56 to the logical disk in the disk device 56 is not functioning effectively, it is possible to prevent a serious system failure from occurring.

また、ウェブサービス提供システム12では、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化として、各サーバ毎に4個設けられているネットワーク接続デバイス54の全てにIPアドレスを割り当てている(但し、単一の仮想的なネットワーク接続デバイスを構成する2個1組のネットワーク接続デバイス54には同一のIPアドレスが割り当てされる)が、例えば故障等により何れかのネットワーク接続デバイス54を交換した等の場合、交換後のネットワーク接続デバイス54に対してIPアドレスの割り当てが行われない等により、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化が有効に機能しない状態(無効状態)に陥る可能性がある。   Further, in the web service providing system 12, as a redundant IP address assignment to the network connection device 54, IP addresses are assigned to all four network connection devices 54 provided for each server (however, The same IP address is assigned to a set of two network connection devices 54 constituting a single virtual network connection device). For example, one of the network connection devices 54 is replaced due to a failure or the like. In this case, there is a possibility that the IP address allocation to the network connection device 54 does not function effectively (invalid state) because the IP address is not allocated to the network connection device 54 after replacement. There is.

これに対して本実施形態では、上記の状態に陥ると、先のステップ120で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、IPアドレス未割り当てのネットワーク接続デバイス54に対してIPアドレスを割り当てさせる作業が行われることで、障害の発生時に、IPアドレス未割り当てのネットワーク接続デバイス54が存在していたことで、重大なシステム障害へ発展することが未然に防止される。   On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the previous step 120 becomes inconsistent with the state information of the master, thereby detecting that the state has fallen into the above state. Will be notified. Then, the administrator performs the work of assigning an IP address to the network connection device 54 to which the IP address is not assigned, so that the network connection device 54 to which the IP address is not assigned exists when a failure occurs. Therefore, it is possible to prevent a serious system failure from occurring.

また、ウェブサービス提供システム12では、各サーバ26〜32とネットワーク14との接続の冗長化として、互いに異なるネットワークアダプタ52に取付けられた2個1組のネットワーク接続デバイス54により単一の仮想的なネットワーク接続デバイスを構成しているが、例えばネットワーク接続デバイス54又はネットワークアダプタ52を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とネットワーク14との接続の冗長化が有効に機能しない状態に陥る可能性がある。   Further, in the web service providing system 12, as a redundant connection between the servers 26 to 32 and the network 14, a single virtual connection is made by a set of two network connection devices 54 attached to different network adapters 52. Although the network connection device is configured, for example, when the network connection device 54 or the network adapter 52 is replaced, redundancy of the connection between the servers 26 to 32 and the network 14 due to a mistake in connection restoration work after the replacement, etc. There is a possibility that the computer will not function effectively.

これに対して本実施形態では、上記の状態に陥ると、先のステップ124で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとネットワーク14との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとネットワーク14との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。   On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 124 becomes inconsistent with the state information of the master. Will be notified. Then, the administrator performs an operation to restore the state in which the redundancy of the connection between the corresponding server and the network 14 functions effectively, so that any of the servers 26 to 32 and the network 14 can be connected when a failure occurs. Since the redundant connection is not functioning effectively, it is possible to prevent a serious system failure.

更に、ウェブサービス提供システム12では、単一のクラスタを構成するサーバが冗長化され、DBサーバ26,28によって単一のクラスタが構成され、APサーバ30,32によって単一のクラスタが構成されているが、例えば待機系のサーバのハードウェアに故障が発生した等の場合、当該サーバの稼働状態が「待機中」から「停止中」へ変化することで、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態に陥る可能性がある。   Further, in the web service providing system 12, servers constituting a single cluster are made redundant, a single cluster is constituted by the DB servers 26 and 28, and a single cluster is constituted by the AP servers 30 and 32. However, for example, when a failure occurs in the hardware of a standby server, the operating status of the server changes from “standby” to “stopped”. There is a possibility that redundancy will not work effectively.

これに対して本実施形態では、上記の状態に陥ると、先のステップ104で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、例えば故障したハードゥエアの交換する等により、稼働状態が「停止中」のサーバを「待機中」へ復旧させる作業が行われることで、障害の発生時に、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。   On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 104 becomes inconsistent with the state information of the master. Will be notified. Then, the administrator performs work to restore a server that is in a “stopped” state to “standby” by, for example, exchanging a failed hard air, so that a single cluster can be created when a failure occurs. Since the redundancy of the servers to be configured does not function effectively, a serious system failure can be prevented from occurring.

また、ウェブサービス提供システム12では、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続する2個のHBA50が互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されているが、例えばHBA50又はチャネル・アダプタ(CHA)64(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態に陥る可能性がある。   In the web service providing system 12, two HBAs 50 for connecting a single server to the disk device 56 as a redundant connection between the servers 26 to 32 and the disk device 56 (disk control device (DKC) 60). Are connected to channel adapters (CHA) 64 of different clusters 62. However, when the HBA 50 or the channel adapter (CHA) 64 (or the cluster 62) is replaced, for example, the connection restoration work error after replacement is incorrect. For example, there is a possibility that the redundant connection between the servers 26 to 32 and the disk device 56 (disk control device (DKC) 60) does not function effectively.

これに対して本実施形態では、上記の状態に陥ると、先のステップ108で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。   On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the previous step 108 becomes inconsistent with the state information of the master, so that it is detected that the state has fallen into the above state. Will be notified. Then, the administrator performs an operation to restore the state in which the redundancy of the connection between the corresponding server and the disk device 56 (disk control device (DKC) 60) functions effectively, so that when the failure occurs, the server Since the redundancy of the connection between any one of 26 to 32 and the disk device 56 (disk control device (DKC) 60) does not function effectively, it is possible to prevent a serious system failure from occurring. .

一方、管理者が状態情報の全内容の確認を所望している場合は、管理者により端末装置16を介し出力対象として状態情報の「全内容」が選択される。この場合はステップ134からステップ138へ移行し、例として図4(B)に示すように、状態情報の各項目毎に、マスタ及び今回の状態情報の内容を各々表示した内容表示画面を生成し、生成した内容表示画面のデータを端末装置16へ送信することで、図4(B)に示すような内容表示画面を端末装置16のディスプレイ18に表示させる。なお、ステップ134〜ステップ138は請求項9に記載の出力手段による処理の一例である。また、管理者による状態情報の比較結果又は全内容の確認が終了するとステップ140へ移行し、状態情報のマスタの更新が管理者から指示されたか否か判定する。通常はこの判定は否定され、冗長化構成検証処理を終了する。   On the other hand, when the administrator desires to confirm the entire contents of the status information, the administrator selects “all contents” of the status information as an output target via the terminal device 16. In this case, the process proceeds from step 134 to step 138, and as shown in FIG. 4B as an example, a content display screen displaying the contents of the master and the current state information for each item of the state information is generated. Then, the generated content display screen data is transmitted to the terminal device 16 to display the content display screen as shown in FIG. 4B on the display 18 of the terminal device 16. Steps 134 to 138 are an example of processing by the output means according to claim 9. Further, when the comparison of the status information by the administrator or the confirmation of all contents is completed, the process proceeds to step 140, and it is determined whether or not the administrator has instructed to update the master of the status information. Normally, this determination is negative and the redundant configuration verification process is terminated.

ところで、今回の状態情報がマスタと不一致になる原因としては、先に説明したように、接続復旧作業のミス等により、ウェブサービス提供システム12の何れかの部分の冗長化が有効に機能しない状態に陥った場合以外に、例えばウェブサービス提供システム12の仕様変更に伴い意図的に構成を変更した等の場合も考えられる。この場合、ウェブサービス提供システム12は以後、変更後の構成で運用されるので、管理者は状態情報のマスタの更新を指示する。この場合はステップ140の判定が肯定されてステップ142へ移行し、記憶部38の所定の記憶領域に記憶されている状態情報のマスタに上書きして今回の状態情報を記憶させ、冗長化構成検証処理を終了する。この場合は、今回の状態情報が以後、状態情報のマスタとして用いられることになる。   By the way, the reason why the current status information is inconsistent with the master is that, as described above, redundancy in any part of the web service providing system 12 does not function effectively due to a mistake in connection restoration work or the like. In addition to the case, the configuration may be changed intentionally, for example, in accordance with the specification change of the web service providing system 12. In this case, since the web service providing system 12 is subsequently operated with the changed configuration, the administrator instructs the update of the status information master. In this case, the determination at step 140 is affirmed and the routine proceeds to step 142 where the current state information is overwritten on the master of the state information stored in the predetermined storage area of the storage unit 38 to verify the redundant configuration. The process ends. In this case, the current state information will be used as the state information master.

次に、先に説明したステップ126で取得対象となる(又はその可能性がある)状態情報について説明する。冗長化された部分を有するコンピュータ・システムにおいて、その冗長化が有効に機能する状態を維持しているか否かの判定項目としては、ステップ102〜ステップ124で取得される状態情報を用いて実現可能な項目以外に、例えば次の表1に示す判定項目が挙げられる。   Next, the state information to be acquired (or possibly) in step 126 described above will be described. In a computer system having a redundant portion, it is possible to use the state information acquired in steps 102 to 124 as a determination item as to whether or not the redundancy is maintaining a functioning state. In addition to these items, for example, the determination items shown in the following Table 1 are listed.

Figure 2011134070
Figure 2011134070

上記各項目の判定を行う必要があるか否かは、検証対象のコンピュータ・システムにおける冗長化の構成によって個々の項目毎に相違しているので、検証対象のコンピュータ・システムに適した判定項目を予め選択しておき、選択した判定項目の判定が可能な状態情報を先のステップ126で取得するようにすればよい。   Whether or not each of the above items needs to be determined differs depending on the individual items depending on the redundancy configuration in the computer system to be verified. Therefore, a determination item suitable for the computer system to be verified is selected. It is only necessary to select in advance and obtain state information capable of determining the selected determination item in the previous step 126.

なお、検証対象のコンピュータ・システム10は図2に示した構成に限られるものではなく、本発明は冗長化された部分を有する任意のコンピュータ・システムに適用可能である。   Note that the computer system 10 to be verified is not limited to the configuration shown in FIG. 2, and the present invention is applicable to any computer system having a redundant portion.

また、上記では検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を構成するコンピュータ(サーバ26〜32)を本発明に係る冗長状態検証装置として機能させる態様を説明したが、これに限定されるものではなく、検証対象のコンピュータ・システムと接続された別のコンピュータを本発明に係る冗長状態検証装置として機能させることも可能である。   Moreover, although the above demonstrated the aspect which makes the computer (server 26-32) which comprises the web service provision system 12 as a computer system of verification object function as a redundant state verification apparatus based on this invention, it is limited to this. Instead of this, another computer connected to the computer system to be verified can be made to function as the redundant state verification apparatus according to the present invention.

また、上記では本発明に係る冗長化構成検証プログラムが各サーバ26〜32の記憶部38に予め記憶(インストール)されている態様を説明したが、本発明に係る冗長状態検証プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。   In the above description, the redundant configuration verification program according to the present invention is stored (installed) in advance in the storage unit 38 of each of the servers 26 to 32. However, the redundant state verification program according to the present invention is a CD- It is also possible to provide the information recorded in a recording medium such as a ROM or a DVD-ROM.

10 コンピュータ・システム
12 ウェブサービス提供システム
16 端末装置
18 ディスプレイ
26,28 DBサーバ
30,32 APサーバ
50A,50B HBA
52 ネットワークアダプタ
54A,54B ネットワーク接続デバイス
60 ディスク制御装置(DKC)
62A,62B クラスタ
64 チャネル・アダプタ(CHA)
70 ディスク・アダプタ(DKA)
10 Computer system 12 Web service providing system 16 Terminal device 18 Display 26, 28 DB server 30, 32 AP server 50A, 50B HBA
52 Network Adapter 54A, 54B Network Connection Device 60 Disk Controller (DKC)
62A, 62B Cluster 64 Channel Adapter (CHA)
70 Disk adapter (DKA)

Claims (11)

記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段と、
前記取得手段によって取得された前記状態情報を記憶する記憶手段と、
前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、
を含む冗長状態検証装置。
Whether the connection between the controller provided in the storage device and the storage medium main body of the storage device is made redundant by inquiring about the state of the redundant part in the computer system to be verified including the storage device First state information indicating whether or not, and second state information indicating whether or not the path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant Acquisition means for acquiring state information including;
Storage means for storing the status information acquired by the acquisition means;
By comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit, the redundancy of the computer system to be verified is obtained. Determining means for determining whether or not the portion maintains a state in which the redundancy functions effectively;
A redundant state verification device including:
前記検証対象のコンピュータ・システムは、前記コントローラと前記記憶媒体本体との接続の冗長化として、前記記憶装置に冗長化された複数の前記コントローラが設けられ、個々の前記コントーラに複数の媒体側アダプタが各々設けられ、複数の前記コントローラの各々毎に、個々の媒体側アダプタが、冗長化された複数の共有メモリのうちの互いに異なる共有メモリを経由して前記記憶媒体本体と接続された構成であり、
前記取得手段は、前記コントローラに対し、複数の前記コントローラの各々と前記記憶装置の記憶媒体本体との間の接続経路を個々の前記媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第1状態情報として取得する請求項1記載の冗長状態検証装置。
The computer system to be verified is provided with a plurality of redundant controllers in the storage device as a redundant connection between the controller and the storage medium body, and a plurality of medium side adapters are provided in each of the controllers. Are provided, and for each of the plurality of controllers, each medium-side adapter is connected to the storage medium body via a different shared memory among a plurality of redundant shared memories. Yes,
The acquisition means transmits a command requesting information indicating the connection path between each of the plurality of controllers and the storage medium main body of the storage device for each of the medium-side adapters to the controller. The redundant state verification device according to claim 1, wherein the information is acquired from the controller as the first state information.
前記検証対象のコンピュータ・システムは、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスの冗長化として、前記コンピュータに冗長化された複数のホストアダプタが設けられ、前記記憶装置のコントローラに、複数の前記ホストアダプタの何れかと接続される冗長化された複数のホスト側アダプタと、複数の前記ホスト側アダプタの何れかと接続されると共に前記記憶装置の記憶媒体本体と接続され冗長化された複数の媒体側アダプタと、が各々設けられ、前記コンピュータ上で動作する所定のプログラムが、前記検証対象のコンピュータ・システムの個々の前記ホストアダプタから前記記憶装置の記憶媒体本体に至る個々のパス毎に経路及び稼働状態を管理する構成であり、
前記取得手段は、前記所定のプログラムに対し、前記検証対象のコンピュータ・システムの個々の前記ホストアダプタから前記記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第2状態情報として取得する請求項1記載の冗長状態検証装置。
The computer system to be verified is provided with a plurality of redundant host adapters in the computer as a path redundancy between a computer of the computer system to be verified and a storage medium body of the storage device. A plurality of redundant host-side adapters connected to any of the plurality of host adapters to the controller of the storage device; and a storage medium body of the storage device connected to any of the plurality of host-side adapters A plurality of medium-side adapters connected to each other and made redundant, and a predetermined program operating on the computer is transferred from each host adapter of the computer system to be verified to a storage medium of the storage device It is a configuration that manages the route and operating status for each path to the main unit,
The acquisition means requests the predetermined program for information indicating a path and an operation state for each path from each host adapter of the computer system to be verified to the storage medium body of the storage device. The redundant state verification apparatus according to claim 1, wherein the information is acquired as the second state information from the controller by transmitting a command.
ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段と、
前記取得手段によって取得された前記状態情報を記憶する記憶手段と、
前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、
を含む冗長状態検証装置。
A state in which the IP address assignment to the network connection device is made redundant by inquiring about the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device Third status information indicating whether or not, and fourth indicating whether or not the assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant Acquisition means for acquiring state information including state information;
Storage means for storing the status information acquired by the acquisition means;
By comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit, the redundancy of the computer system to be verified is obtained. Determining means for determining whether or not the portion maintains a state in which the redundancy functions effectively;
A redundant state verification device including:
前記検証対象のコンピュータ・システムは、前記ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化として、前記ネットワーク接続デバイスが複数設けられていると共に、複数の前記ネットワーク接続デバイスの各々にIPアドレスが割り当てされる構成であり、
前記取得手段は、オペレーティング・システムに対し、複数の前記ネットワーク接続デバイスの各々に割り当てられているIPアドレスを表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから前記情報を前記第3状態情報として取得する請求項4記載の冗長状態検証装置。
The computer system to be verified is provided with a plurality of network connection devices as a redundant IP address assignment to the network connection devices, and an IP address is assigned to each of the plurality of network connection devices. The configuration
The acquisition means transmits a command requesting information representing an IP address assigned to each of the plurality of network connection devices to the operating system, thereby obtaining the information from the operating system. The redundant state verification apparatus according to claim 4, which is acquired as state information.
前記検証対象のコンピュータ・システムは、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスの前記ネットワークアダプタへの割り当ての冗長化として、前記ネットワーク接続デバイスが複数設けられ、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスが互いに異なるネットワークアダプタに割り当てされる構成であり、
前記取得手段は、オペレーティング・システムに対し、複数の前記ネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから前記情報を前記第4状態情報として取得する請求項4記載の冗長状態検証装置。
The computer system to be verified is provided with a plurality of network connection devices as a redundancy of assignment of a plurality of network connection devices constituting a single network connection device to the network adapter. A plurality of network connection devices constituting a single network connection device are assigned to different network adapters,
The acquisition means transmits the command from the operating system to the operating system by sending a command requesting information indicating to which network adapter each of the plurality of network connection devices is assigned. The redundant state verification apparatus according to claim 4, which is acquired as the fourth state information.
前記検証対象のコンピュータ・システムは、クラスタを構成するコンピュータの冗長化として、単一のクラスタが複数台のコンピュータで構成された構成であり、
前記取得手段は、オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから、前記情報を、前記検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得する請求項1又は請求項4記載の冗長状態検証装置。
The computer system to be verified is a configuration in which a single cluster is composed of a plurality of computers as redundancy of computers constituting the cluster,
The acquisition unit transmits a command requesting information indicating the number of computers constituting a single cluster of the computer system to be verified and each operation state to the operating system. 5. The information according to claim 1, wherein the information is acquired as fifth status information indicating whether or not a single cluster of the computer system to be verified is configured by a plurality of computers. Redundant state verification device.
前記検証対象のコンピュータ・システムは記憶装置を含んで構成され、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置との接続の冗長化として、前記コンピュータに冗長化された複数のホストアダプタが設けられ、複数の前記ホストアダプタのうち対を成すホストアダプタが、前記記憶装置に設けられ冗長化された複数のコントローラのうちの異なる前記コントローラに接続された構成であり、
前記取得手段は、前記コントローラに対し、複数の前記ホストアダプタの各々が、複数の前記コントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数の前記ホストアダプタのうち対を成すホストアダプタが複数の前記コントローラのうちの異なる前記コントローラに接続されている状態か否かを表す第6状態情報として取得する請求項1又は請求項4記載の冗長状態検証装置。
The computer system to be verified includes a storage device, and a plurality of redundant host adapters are provided in the computer as a redundant connection between the computer of the computer system to be verified and the storage device. A pair of host adapters among the plurality of host adapters are connected to different controllers among a plurality of redundant controllers provided in the storage device,
The acquisition unit transmits the information to the controller by requesting information indicating which of the plurality of host adapters each of the plurality of host adapters is connected to. 5. The redundant state verification according to claim 1, wherein the redundant state verification is acquired as sixth state information indicating whether or not a pair of host adapters is connected to a different one of the plurality of controllers. apparatus.
前記判定手段により、前記検証対象のコンピュータの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持していないと判定された場合に、前記取得手段によって取得された前記状態情報が表す前記冗長化部分の現在の状態を通知する情報を出力する出力手段を更に備えた請求項1〜請求項8の何れか1項記載の冗長状態検証装置。   The state information acquired by the acquisition unit when the determination unit determines that the redundant portion of the computer to be verified does not maintain a state in which the redundancy functions effectively. The redundant state verification apparatus according to claim 1, further comprising output means for outputting information for notifying a current state of the redundant portion represented by 記憶装置を含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、
前記検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段、
及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段
として機能させるための冗長状態検証プログラム。
A computer comprising a storage device, comprising a computer system to be verified or connected to the computer system to be verified, and comprising a storage means;
Whether or not the connection between the controller provided in the storage device and the storage medium body of the storage device is made redundant by inquiring about the state of the redundant portion in the computer system to be verified State information including first state information to be expressed and second state information to indicate whether or not a path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant Acquisition means to acquire,
And the redundancy of the computer system to be verified by comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit A redundant state verification program for causing the determined portion to function as a determination unit that determines whether or not the redundancy is functioning effectively.
ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、
前記検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段、
及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段
として機能させるための冗長状態検証プログラム。
A computer comprising a computer system to be verified including a computer connected to a network via a network connection device or connected to the computer system to be verified and having a storage means,
Third state information indicating whether or not the assignment of the IP address to the network connection device is made redundant by inquiring about the current state of the redundant portion in the computer system to be verified; and virtual Acquisition means for acquiring state information including fourth state information indicating whether or not assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant;
And the redundancy of the computer system to be verified by comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit A redundant state verification program for causing the determined portion to function as a determination unit for determining whether or not the state in which the redundancy is functioning effectively is maintained.
JP2009292480A 2009-12-24 2009-12-24 Redundant state verification device and program Active JP4902728B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009292480A JP4902728B2 (en) 2009-12-24 2009-12-24 Redundant state verification device and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009292480A JP4902728B2 (en) 2009-12-24 2009-12-24 Redundant state verification device and program

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2011286502A Division JP5216910B2 (en) 2011-12-27 2011-12-27 Redundant state verification device

Publications (2)

Publication Number Publication Date
JP2011134070A true JP2011134070A (en) 2011-07-07
JP4902728B2 JP4902728B2 (en) 2012-03-21

Family

ID=44346740

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009292480A Active JP4902728B2 (en) 2009-12-24 2009-12-24 Redundant state verification device and program

Country Status (1)

Country Link
JP (1) JP4902728B2 (en)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167794A (en) * 2001-11-29 2003-06-13 Hitachi Ltd SAN access path diagnostic system
JP2007310656A (en) * 2006-05-18 2007-11-29 Hitachi Ltd Computer system and logical path difference detection method
JP2007334484A (en) * 2006-06-13 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Communication device and physical interface switching method of communication device

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003167794A (en) * 2001-11-29 2003-06-13 Hitachi Ltd SAN access path diagnostic system
JP2007310656A (en) * 2006-05-18 2007-11-29 Hitachi Ltd Computer system and logical path difference detection method
JP2007334484A (en) * 2006-06-13 2007-12-27 Nippon Telegr & Teleph Corp <Ntt> Communication device and physical interface switching method of communication device

Also Published As

Publication number Publication date
JP4902728B2 (en) 2012-03-21

Similar Documents

Publication Publication Date Title
JP4940967B2 (en) Storage system, storage device, firmware hot replacement method, firmware hot swap program
US7464236B2 (en) Storage system and storage management method
US7480780B2 (en) Highly available external storage system
JP4958673B2 (en) Storage system and management method thereof
EP1760591B1 (en) System and method of managing access path
JP4572250B2 (en) Computer switching method, computer switching program, and computer system
JP5486793B2 (en) Remote copy management system, method and apparatus
JP2005326935A (en) Management server for computer system with virtualized storage and failure avoidance recovery method
WO2014083598A1 (en) Hierarchical storage system and file management method
IE20000203A1 (en) Storage domain management system
US7937481B1 (en) System and methods for enterprise path management
US8234447B2 (en) Storage control device for storage system provided with storage device coupled to switch network
JP2007226400A (en) Computer management method, computer management program, standby server for managing configuration of execution server, and computer system
WO2015025358A1 (en) Storage system and control method for storage system
US20120047327A1 (en) Disk array device and control method for the same
JPWO2004104845A1 (en) Storage system
US20110047410A1 (en) Redundant configuration method of a storage system maintenance/management apparatus
JP2013117922A (en) Disk system, data holding device, and disk device
US20080288671A1 (en) Virtualization by multipath management software for a plurality of storage volumes
US7886186B2 (en) Storage system and management method for the same
JP2004341994A (en) Program, information processing apparatus, and control method of information processing apparatus
US8112598B2 (en) Apparatus and method for controlling copying
JP2009259031A (en) Method of managing paths for externally-connected storage system and method of detecting fault site
WO2013171865A1 (en) Management method and management system
US8583789B2 (en) Computer system management method and management apparatus

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20111116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111206

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111228

R150 Certificate of patent or registration of utility model

Ref document number: 4902728

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150113

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S533 Written request for registration of change of name

Free format text: JAPANESE INTERMEDIATE CODE: R313533

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250