JP2011134070A - Redundant state inspection device and program - Google Patents
Redundant state inspection device and program Download PDFInfo
- Publication number
- JP2011134070A JP2011134070A JP2009292480A JP2009292480A JP2011134070A JP 2011134070 A JP2011134070 A JP 2011134070A JP 2009292480 A JP2009292480 A JP 2009292480A JP 2009292480 A JP2009292480 A JP 2009292480A JP 2011134070 A JP2011134070 A JP 2011134070A
- Authority
- JP
- Japan
- Prior art keywords
- redundant
- state
- computer system
- verified
- state information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Hardware Redundancy (AREA)
- Debugging And Monitoring (AREA)
Abstract
【課題】冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知する。
【解決手段】冗長化された部分を有する検証対象のコンピュータ・システムについて、例えばディスク装置56の制御装置60と論理ディスクとの接続が冗長化されているか否かを表す情報等のように、冗長化の状態を表す各種の状態情報を取得し(102〜126)、今回の処理実行が初回であれば取得した状態情報をマスタとして記憶させ(130)、2回目以降の実行であれば取得した状態情報をマスタと比較し(132)、状態情報の各項目毎のマスタとの一致/不一致と、不一致の項目の状態情報の内容を端末装置に表示させる(136)。
【選択図】図3A computer system having a redundant portion detects that a serious failure is caused when a failure occurs because the redundancy does not function effectively.
For a computer system to be verified having a redundant portion, redundancy such as information indicating whether or not the connection between a control device 60 of a disk device 56 and a logical disk is redundant is used. Various state information indicating the state of the conversion is acquired (102 to 126), and if the current process execution is the first time, the acquired state information is stored as a master (130), and if it is the second or subsequent execution, it is acquired The status information is compared with the master (132), and the contents of the status information of the mismatched items and the match / mismatch with each master of the status information are displayed on the terminal device (136).
[Selection] Figure 3
Description
本発明は冗長状態検証装置及びプログラムに係り、特に、冗長化された部分を有するコンピュータ・システムの状態を検証する冗長状態検証装置、及び、コンピュータを前記冗長状態検証装置として機能させるための冗長状態検証プログラムに関する。 The present invention relates to a redundant state verification device and a program, and more particularly to a redundant state verification device for verifying the state of a computer system having a redundant portion, and a redundant state for causing a computer to function as the redundant state verification device. It relates to the verification program.
コンピュータ・システムの耐障害性の向上にはシステム構成の冗長化が有効であり、安定稼働に対する要求水準の高いコンピュータ・システムでは、現用系が障害の発生により稼働を停止すると稼働状態へ切り替わる待機系が追加されたシステム構成が採用されることが一般的である。しかし、冗長化されたコンピュータ・システムであっても、例えばシステム環境を変更した等の場合に、システム環境の変更が予期せぬ影響を及ぼすことで、現用系が稼働を停止しても待機系が稼働状態へ切り替わらない等のように、冗長化が有効に機能しない状態に陥ることが生じ得る。そして、冗長化が有効に機能しない状態は、通常時は待機系が稼働していないために管理者が気付かないことも多く、この状態が見過ごされた場合、現用系が稼働を停止しても待機系が稼働状態へ切り替わらずに両系共に稼働停止状態となることで、大規模なシステム障害が引き起されるという問題があった。 In order to improve the fault tolerance of a computer system, redundancy of the system configuration is effective. In a computer system with a high level of requirement for stable operation, a standby system that switches to an operating state when the active system stops operation due to a failure. Generally, a system configuration to which is added is adopted. However, even in a redundant computer system, for example, when the system environment is changed, the change of the system environment has an unexpected effect, so that even if the active system stops operating, the standby system It may happen that the redundancy does not function effectively such that the system does not switch to the operating state. And when redundancy does not function effectively, the standby system is not normally operating and the administrator is often not aware. If this state is overlooked, the active system can stop operating. There was a problem that a large-scale system failure was caused by both systems becoming inactive without the standby system being switched to the active state.
上記に関連して特許文献1には、システム構成を検証する要求を受け取ると、システム構成の問題を識別するための1つ以上の規則を規則データを取得すると共に、システム構成に関する情報を含むシステム構成データを取得し、システム構成データを規則データに照らして検証し、システムのための全ての構成問題を識別する検証の結果を生成する技術が開示されている。
In relation to the above,
また特許文献2には、コンピュータ・システムを構築する際に用いるシステム構成情報を記したパラメータシートと、オペレーティング・システムの情報であるシステム構成情報と、の対応箇所を比較し、比較結果を一覧表で色分けした比較レポートを出力する技術が開示されている。
特許文献1に記載の技術は、規則データに基づいてシステム構成を検証する技術であるが、特許文献1には、冗長化された部分を有するコンピュータ・システムに対するシステム構成の検証について何ら記載されておらず、冗長化された部分のうち現用系は正常に稼働しているものの、待機系が稼働状態へ切り替わらない状態(冗長化が有効に機能しない状態)となっている可能性があるコンピュータ・システムに対し、冗長化が有効に機能しない状態をシステム構成の問題として識別することや、その識別のために必要な規則データの内容等については示唆すら見当たらない。
The technique described in
また、特許文献2に記載の技術は、コンピュータ・システムを構築する際に用いたシステム構成情報(を記したパラメータシート)と、構築したコンピュータシステムから取得したシステム構成情報とを比較することで、システムの構築が当初の予定通りに行われたか否かを確認するものであり、この特許文献2にも、冗長化された部分を有するコンピュータ・システムに適用することや、当該コンピュータ・システムが冗長化が有効に機能する状態か否かを確認するための構成について何ら記載されていない。
In addition, the technique described in
本発明は上記事実を考慮して成されたもので、冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる冗長状態検証装置及び冗長状態検証プログラムを得ることが目的である。 The present invention has been made in consideration of the above facts, and a computer system having a redundant portion is in a state where a serious failure is caused when a failure occurs because the redundancy does not function effectively. An object of the present invention is to obtain a redundant state verification device and a redundant state verification program that can detect the occurrence of failure.
本願発明者は、冗長化された部分を有するコンピュータ・システムが、仮に冗長化が有効に機能しない状態であった場合に、現用系に障害が発生した際に冗長化が有効に機能しない状態であることが及ぼす影響の大きさ(システム障害の重大さ)を検証する作業を行った。その結果、冗長化が有効に機能しない状態であることが障害発生時に及ぼす影響の大きさは、冗長化が有効に機能しない状態がシステムの何れの部分に生じているかに応じて大きく相違することが明らかになった。そして、記憶装置を含むコンピュータ・システムにおける特に重大なシステム障害はコンピュータと記憶装置との通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、記憶装置のコントローラと記憶媒体本体との接続が冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、前記システムのコンピュータと記憶装置の記憶媒体本体との間のパスが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。 The inventor of the present application states that if a computer system having a redundant portion is in a state where redundancy is not functioning effectively, the redundancy does not function effectively when a failure occurs in the active system. The work of verifying the magnitude of the impact of something (the severity of system failure) was conducted. As a result, the magnitude of the effect that a failure does not function effectively when a failure occurs will vary greatly depending on which part of the system the redundancy does not function effectively. Became clear. A particularly serious system failure in a computer system including a storage device is a system failure in which communication between the computer and the storage device is interrupted. When a system failure is caused, the connection between the controller of the storage device and the storage medium body is made redundant, but the redundancy is not functioning effectively, and the computer of the system The path between the storage device and the storage medium main body of the storage device was made redundant, but it became clear that this redundancy was not functioning effectively.
上記に基づき請求項1記載の発明に係る冗長状態検証装置は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。
Based on the above, the redundant state verification device according to
請求項1記載の発明では、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。 According to the first aspect of the present invention, the connection between the controller provided in the storage device and the storage medium main body of the storage device is made by inquiring about the state of the redundant part in the computer system to be verified including the storage device. First state information indicating whether or not the state is redundant, and whether or not the path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant The state information including the second state information representing is acquired by the acquisition unit, and the state information acquired by the acquisition unit is stored in the storage unit. The state information acquired by the acquisition unit is information indicating the current state of the redundant part of the computer system to be verified, and the determination unit stores the state information acquired by the acquisition unit in the past by the acquisition unit. Compared with the status information obtained and stored in the storage means, the redundant part of the computer system to be verified is in a state in which redundancy functions effectively (the active system has failed and is operating. When the system is stopped, it is determined whether or not the standby system is maintained in a state of switching to the operating state.
これにより、判定手段による判定では、取得手段によって取得された第1状態情報に基づき、記憶装置のコントローラと記憶装置の記憶媒体本体との接続の冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第2状態情報に基づき、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、請求項1記載の発明によれば、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。 Thereby, in the determination by the determination unit, is the state in which the redundancy of the connection between the controller of the storage device and the storage medium body of the storage device functions effectively based on the first state information acquired by the acquisition unit? A state in which the redundancy of the path between the computer of the computer system to be verified and the storage medium body of the storage device functions effectively based on the second state information acquired by the acquisition unit It is also determined whether or not the above is maintained. Therefore, according to the first aspect of the present invention, a computer system having a redundant portion including a storage device is in a state in which a serious failure is caused when a failure occurs because the redundancy does not function effectively. Can be detected.
なお、請求項1記載の発明において、検証対象のコンピュータ・システムが、コントローラと記憶媒体本体との接続の冗長化として、記憶装置に冗長化された複数のコントローラが設けられ、個々のコントーラに複数の媒体側アダプタが各々設けられ、複数のコントローラの各々毎に、個々の媒体側アダプタが、冗長化された複数の共有メモリのうちの互いに異なる共有メモリを経由して記憶媒体本体と接続された構成である場合、取得手段は、例えば請求項2に記載したように、コントローラに対し、複数のコントローラの各々と記憶装置の記憶媒体本体との間の接続経路を個々の媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、コントローラから前記情報を第1状態情報として取得するように構成することができる。
In the first aspect of the invention, the computer system to be verified is provided with a plurality of redundant controllers in the storage device as a redundant connection between the controller and the storage medium body, and a plurality of controllers are provided in each controller. Medium-side adapters are provided, and for each of the plurality of controllers, the individual medium-side adapters are connected to the storage medium body via different shared memories among the plurality of redundant shared memories. In the case of the configuration, for example, as described in
また、請求項1記載の発明において、検証対象のコンピュータ・システムが、検証対象のコンピュータ・システムのコンピュータと記憶装置の記憶媒体本体との間のパスの冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、記憶装置のコントローラに、複数のホストアダプタの何れかと接続される冗長化された複数のホスト側アダプタと、複数のホスト側アダプタの何れかと接続されると共に記憶装置の記憶媒体本体と接続され冗長化された複数の媒体側アダプタと、が各々設けられ、コンピュータ上で動作する所定のプログラムが、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎に経路及び稼働状態を管理する構成である場合、取得手段は、例えば請求項3に記載したように、所定のプログラムに対し、検証対象のコンピュータ・システムの個々のホストアダプタから記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、コントローラから前記情報を第2状態情報として取得するように構成することができる。
Further, in the first aspect of the present invention, a plurality of computer systems to be verified are made redundant to the computer as a path redundancy between the computer of the computer system to be verified and the storage medium body of the storage device. A plurality of redundant host-side adapters connected to any of the plurality of host adapters, and connected to any of the plurality of host-side adapters, and storage of the storage device A plurality of medium-side adapters connected to the medium body and made redundant, and a predetermined program operating on the computer is transferred from each host adapter of the computer system to be verified to the storage medium body of the storage device. In the case of a configuration that manages the route and the operating state for each individual path to reach, the acquisition means, for example, As described in
また、本願発明者による前述の検証作業の結果、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含むコンピュータ・システムにおいて、特に重大なシステム障害はコンピュータとネットワークとの通信が途絶するシステム障害であり、冗長化が有効に機能しない状態となっていることで障害発生時に上記のシステム障害を引き起される場合は、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されていたものの、この冗長化が有効に機能しない状態となっていた場合であることが明らかになった。 In addition, as a result of the above-described verification work by the present inventor, in a computer system including a computer connected to a network via a network connection device, a particularly serious system failure is a system failure in which communication between the computer and the network is interrupted. Yes, if the above system failure is caused when a failure occurs because redundancy is not functioning effectively, the IP address assignment to the network connection device has been made redundant. In the state where the networking is not functioning effectively, and the assignment of a plurality of the network connection devices constituting the single network connection device virtually to the network adapter is made redundant. Is in a state that does not function effectively. It became apparent.
上記に基づき請求項4記載の発明に係る冗長状態検証装置は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段と、前記取得手段によって取得された前記状態情報を記憶する記憶手段と、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、を含んで構成されている。 Based on the above, the redundant state verification apparatus according to the invention described in claim 4 inquires the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device, Third state information indicating whether or not the assignment of the IP address to the network connection device is made redundant, and a plurality of network adapters of the network connection device that virtually configure a single network connection device Acquisition means for acquiring state information including fourth state information indicating whether or not the assignment to is redundant, storage means for storing the state information acquired by the acquisition means, and the acquisition means The status information acquired by the acquisition means in the past by the acquisition means By comparing with the state information stored in the storage means, it is determined whether or not the redundant portion of the computer system to be verified maintains a state in which the redundancy functions effectively Determination means.
請求項4記載の発明では、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報が取得手段によって取得され、取得手段によって取得された状態情報は記憶手段に記憶される。取得手段によって取得される状態情報は、検証対象のコンピュータ・システムの冗長化された部分の現在の状態を表す情報であり、判定手段は、取得手段によって取得された状態情報を、取得手段によって過去に取得されて記憶手段に記憶された状態情報と比較することで、検証対象のコンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態(現用系に障害が発生して稼働を停止した場合に、待機系が稼働状態へ切り替わる状態)を維持しているか否か判定する。 According to the fourth aspect of the present invention, the IP address is assigned to the network connection device by inquiring about the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device. State information indicating whether or not a network is redundant, and a state in which assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant The state information including the fourth state information indicating whether or not is acquired by the acquisition unit, and the state information acquired by the acquisition unit is stored in the storage unit. The state information acquired by the acquisition unit is information indicating the current state of the redundant part of the computer system to be verified, and the determination unit stores the state information acquired by the acquisition unit in the past by the acquisition unit. Compared with the status information obtained and stored in the storage means, the redundant part of the computer system to be verified is in a state in which redundancy functions effectively (the active system has failed and is operating. When the system is stopped, it is determined whether or not the standby system is maintained in a state of switching to the operating state.
これにより、判定手段による判定では、取得手段によって取得された第3状態情報に基づき、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化が有効に機能する状態を維持しているか否かが判定されると共に、取得手段によって取得された第4状態情報に基づき、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化が有効に機能する状態を維持しているか否かも判定されることになる。従って、請求項4記載の発明によれば、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。 Accordingly, in the determination by the determination unit, it is determined whether or not the state in which the redundancy of the IP address assignment to the network connection device is functioning effectively is maintained based on the third state information acquired by the acquisition unit. At the same time, based on the fourth state information acquired by the acquisition means, the state in which the redundancy of the assignment of the plurality of network connection devices constituting the single network connection device to the network adapter effectively functions effectively is maintained. It is also determined whether or not. Therefore, according to the fourth aspect of the present invention, a computer system including a computer connected to a network via a network connection device and having a redundant portion causes a failure because the redundancy does not function effectively. It is possible to detect that a serious failure is sometimes caused.
なお、請求項4記載の発明において、検証対象のコンピュータ・システムが、ネットワーク接続デバイスへのIPアドレスの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられていると共に、複数のネットワーク接続デバイスの各々にIPアドレスが割り当てされる構成である場合、取得手段は、例えば請求項5に記載したように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々に割り当てられているIPアドレスを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第3状態情報として取得するように構成することができる。 In the invention according to claim 4, the computer system to be verified is provided with a plurality of network connection devices as redundant IP address assignment to the network connection devices, and each of the plurality of network connection devices is provided. In the configuration in which the IP address is assigned to each of the plurality of network connection devices, for example, the acquisition unit provides the operating system with information indicating the IP address assigned to each of the plurality of network connection devices. The information can be acquired from the operating system as the third state information by transmitting a command to be requested.
また、請求項4記載の発明において、検証対象のコンピュータ・システムが、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当ての冗長化として、ネットワーク接続デバイスが複数設けられ、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスが互いに異なるネットワークアダプタに割り当てされる構成である場合、取得手段は、例えば請求項6に記載したように、オペレーティング・システムに対し、複数のネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、オペレーティング・システムから前記情報を第4状態情報として取得するように構成することができる。 Further, in the invention described in claim 4, the computer system to be verified is configured such that the network connection device is configured as a redundant allocation of a plurality of network connection devices constituting a single network connection device virtually to a network adapter. In the case where a plurality of network connection devices that are virtually provided and constitute a single network connection device are assigned to different network adapters, the acquisition means may, for example, operate as described in claim 6 Sending a command requesting information indicating to which network adapter each of the plurality of network connection devices is assigned to the system to acquire the information as fourth state information from the operating system Ni It can be.
また、請求項1又は請求項4記載の発明において、検証対象のコンピュータ・システムが、クラスタを構成するコンピュータの冗長化として、単一のクラスタが複数台のコンピュータで構成された構成である場合、取得手段は、例えば請求項7に記載したように、オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、オペレーティング・システムから、前記情報を、検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得するように構成することが好ましい。
Further, in the invention according to
本願発明者による前述の検証作業によれば、単一のクラスタが複数台のコンピュータで構成されることで冗長化されたコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系のコンピュータに障害が発生して稼働を停止すると、前記クラスタ自体が稼働停止状態となることで、大規模なシステム障害が引き起されることが判明している。これに対して請求項7記載の発明では、取得手段によって取得された第5状態情報に基づき、単一のクラスタを構成するコンピュータの冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、
単一のクラスタを複数台のコンピュータで構成する冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
According to the above-described verification work by the inventor of the present application, in a computer system made redundant by configuring a single cluster with a plurality of computers, the redundancy is not functioning effectively. In addition, it has been found that when a failure occurs in the active computer and the operation is stopped, the cluster itself is brought into an operation stop state, thereby causing a large-scale system failure. On the other hand, in the invention according to claim 7, it is also determined whether or not the redundancy of the computers constituting the single cluster is maintained effectively based on the fifth state information acquired by the acquiring means. Because it will be determined by means,
Detects that a redundant computer system consisting of multiple computers in a single cluster has entered a state in which a serious failure has occurred due to the failure of the redundancy. can do.
また、請求項1又は請求項4記載の発明において、検証対象のコンピュータ・システムが記憶装置を含んで構成され、検証対象のコンピュータ・システムのコンピュータと記憶装置との接続の冗長化として、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成である場合、取得手段は、例えば請求項8に記載したように、コントローラに対し、複数のホストアダプタの各々が、複数のコントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数のホストアダプタのうち対を成すホストアダプタが複数のコントローラのうちの異なるコントローラに接続されている状態か否かを表す第6状態情報として取得するように構成することが好ましい。
Further, in the invention according to
本願発明者による前述の検証作業によれば、記憶装置を含んで構成されコンピュータと記憶装置との接続が冗長化された構成、すなわち、コンピュータに冗長化された複数のホストアダプタが設けられ、複数のホストアダプタのうち対を成すホストアダプタが、記憶装置に設けられ冗長化された複数のコントローラのうちの異なるコントローラに接続された構成のコンピュータ・システムにおいて、前記冗長化が有効に機能しない状態となっていた場合にも、現用系の接続に障害が発生すると、コンピュータと記憶装置との通信が途絶する大規模なシステム障害が引き起されることが明らかになっている。これに対して請求項8記載の発明では、取得手段によって取得された第6状態情報に基づき、コンピュータと記憶装置との接続の冗長化が有効に機能する状態を維持しているか否かも判定手段によって判定されることになるので、コンピュータと記憶装置との接続が冗長化がされたコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。 According to the above-described verification work by the inventor of the present application, a configuration in which a storage device is included and the connection between the computer and the storage device is made redundant, that is, the computer is provided with a plurality of redundant host adapters, A state in which the redundancy does not function effectively in a computer system having a configuration in which a pair of host adapters are connected to different controllers among a plurality of redundant controllers provided in the storage device. Even in such a case, it has become clear that when a failure occurs in the connection of the active system, a large-scale system failure that causes the communication between the computer and the storage device to be interrupted is caused. On the other hand, in the invention described in claim 8, based on the sixth state information acquired by the acquisition means, it is also determined whether or not the state in which the redundancy of the connection between the computer and the storage device functions effectively is maintained. Therefore, the computer system in which the connection between the computer and the storage device is made redundant is in a state where a serious failure is caused when a failure occurs because the redundancy does not function effectively. It can be detected.
また、請求項1〜請求項8の何れかに記載の発明において、例えば請求項9に記載したように、判定手段により、検証対象のコンピュータの冗長化された部分が、冗長化が有効に機能する状態を維持していないと判定された場合に、取得手段によって取得された状態情報が表す冗長化部分の現在の状態を通知する情報を出力する出力手段を更に設けることが好ましい。これにより、管理者等の利用者は、検証対象のコンピュータのうち冗長化が有効に機能する状態を維持していないと判定された部分が現在はどのような状態かを容易に把握することができ、冗長化が有効に機能する状態へ回復させるための対策を容易に講ずることができる。
Further, in the invention according to any one of
請求項10記載の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。
The redundant state verification program according to the invention described in
請求項10記載の発明に係る冗長状態検証プログラムは、記憶装置を含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが請求項10記載の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが請求項1に記載の冗長状態検証装置として機能することになり、請求項1記載の発明と同様に、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。
According to a tenth aspect of the present invention, there is provided a redundant state verification program that configures a computer system to be verified that includes a storage device or is connected to the computer system to be verified and includes a computer having storage means. And the computer executes the redundant state verification program according to the invention described in
請求項11記載の発明に係る冗長状態検証プログラムは、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は前記検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、前記検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段、及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段として機能させる。 The redundant state verification program according to the invention described in claim 11 constitutes a computer system to be verified including a computer connected to a network via a network connection device or is connected to the computer system to be verified, The computer having the storage means is inquired about the current state of the redundant portion in the computer system to be verified, thereby indicating whether or not the assignment of the IP address to the network connection device is made redundant. State including third state information and fourth state information indicating whether the assignment of a plurality of network connection devices constituting a single network connection device to a network adapter is made redundant. Acquisition means for acquiring information, and the acquisition means; By comparing the status information acquired in this way with the status information acquired in the past by the acquisition means and stored in the storage means, the redundant portion of the computer system to be verified is , And functioning as a determination means for determining whether or not the redundancy is maintained in a functioning state.
請求項11記載の発明に係る冗長状態検証プログラムは、複数のネットワークアダプタポートを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムを構成するか又は検証対象のコンピュータ・システムと接続され、記憶手段を備えたコンピュータを、上記の取得手段及び判定手段として機能させるためのプログラムであるので、上記のコンピュータが請求項11記載の発明に係る冗長状態検証プログラムを実行することで、上記のコンピュータが請求項4に記載の冗長状態検証装置として機能することになり、請求項4記載の発明と同様に、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知することができる。 The redundant state verification program according to the invention of claim 11 constitutes a computer system to be verified including a computer connected to a network via a plurality of network adapter ports, or is connected to the computer system to be verified. Since the computer having the storage unit functions as the acquisition unit and the determination unit, the computer executes the redundancy state verification program according to the invention described in claim 11, thereby The computer functions as the redundant state verification device according to claim 4, and has a redundant portion including the computer connected to the network via the network connection device as in the invention according to claim 4. The computer system functions effectively with the above redundancy It is possible to detect that a serious failure in a state that is caused in the event of a failure by the absence.
以上説明したように本発明は、記憶装置を含む検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、記憶装置のコントローラと記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、コンピュータと記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、記憶装置を含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。 As described above, the present invention makes the connection between the controller of the storage device and the storage medium main body redundant by inquiring about the state of the redundant portion in the computer system to be verified including the storage device. First state information indicating whether or not, and state information including second state information indicating whether or not the path between the computer and the storage medium body is redundant, and the acquired state information Is compared with the state information acquired in the past to determine whether the redundant portion of the computer system maintains a state in which the redundancy functioning effectively. The computer system having a part can detect that a serious failure is caused when a failure occurs because the redundancy does not function effectively. It was having an effect.
また本発明は、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含む検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数のネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得し、取得した状態情報を過去に取得した状態情報と比較することで、コンピュータ・システムの冗長化された部分が、冗長化が有効に機能する状態を維持しているか否か判定するので、ネットワーク接続デバイスを介してネットワークと接続されたコンピュータを含み冗長化された部分を有するコンピュータ・システムが、前記冗長化が有効に機能しないことで障害発生時に重大な障害が引き起される状態になったことを検知できる、という優れた効果を有する。 In addition, the present invention makes it possible to make redundant assignment of IP addresses to network connection devices by inquiring about the current state of the redundancy part in a computer system to be verified including a computer connected to a network via a network connection device. Third state information indicating whether or not the network is connected, and whether or not the assignment of a plurality of network connection devices constituting a single network connection device to the network adapter is made redundant The state information including the fourth state information is obtained, and the obtained state information is compared with the state information obtained in the past, so that the redundant part of the computer system To determine whether or not the network is connected via the network connection device. The computer system having a redundant part including a connected computer can detect that a serious failure is caused when a failure occurs because the redundancy does not function effectively. It has the effect.
以下、図面を参照して本発明の実施形態の一例を詳細に説明する。図1には本実施形態に係るコンピュータ・システム10が示されている。コンピュータ・システム10は、検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を備え、このウェブサービス提供システム12がイントラネットから成るネットワーク14を介し、管理装置として使用される端末装置16に接続されて構成されている。
Hereinafter, an example of an embodiment of the present invention will be described in detail with reference to the drawings. FIG. 1 shows a
端末装置16はPC(Personal Computer)等から成り、CPU16A、ROMやRAM等を含むメモリ16C、HDD(Hard Disk Drive)やフラッシュメモリ等から成る不揮発性の記憶部16C、通信I/F(インタフェース)部16Dを備え、通信I/F部16Dがネットワーク14に接続されている。記憶部16CにはOS(Operating System)のプログラム(図示省略)やブラウザ(ウェブ閲覧ソフト)のプログラムが各々イントールされている。また端末装置16には、LCD等から成るディスプレイ18、マウス20及びキーボード22が各々接続されている。
The
一方、ウェブサービス提供システム12は、ネットワーク(このネットワークはネットワーク14でもよいし、インターネット等の他のネットワークであってもよい)経由で利用者に所定のウェブサービスを提供するコンピュータ・システムであり、2台のDB(DataBase)サーバ26,28と、2台のAP(APplication)サーバ30,32と、を含んで構成されている。個々のサーバ26〜32はCPU34、ROMやRAM等を含むメモリ36、不揮発性の記憶部38、通信I/F部40を備え、通信I/F部40がネットワーク14に接続され、記憶部38にはOS(Operating System)のプログラム(図示省略)や冗長化構成検証プログラム、パス管理ソフトのプログラムが各々イントールされている。冗長化構成検証プログラム及びパス管理ソフトのプログラムは、各サーバ26〜32の起動時に記憶部38から読み出されてメモリ36に各々記憶され、パス管理ソフトのプログラムはCPU34によって常時実行され、冗長化構成検証プログラムは必要時(端末装置16からの指示時:詳細は後述)にCPU34によって実行される。なお、パス管理ソフトのプログラムは請求項3に記載の所定のプログラムの一例である。
On the other hand, the web
なお、冗長化構成検証プログラムは本発明に係る冗長状態検証プログラムの一例であり、各サーバ26〜32はCPU34によって冗長化構成検証プログラムが実行されることで、本発明に係る冗長状態検証装置として機能する。また、詳細は後述するが、各サーバ26〜32の記憶部38は、実際には後述するディスク装置56(の論理ディスク)によって構成され、各サーバ26〜32の通信I/F部40は実際には後述するネットワークアダプタ52A,52B及びネットワーク接続デバイス54A,54Bによって構成される。
The redundant configuration verification program is an example of the redundant state verification program according to the present invention, and each of the
ウェブサービス提供システム12は、安定稼働に対する要求水準の高いコンピュータ・システムであり、各部分が冗長化されている。すなわち、ウェブサービス提供システム12では、DBサーバが冗長化され、DBサーバ26,28が単一のクラスタを構成しており、DBサーバ26は通常時に稼働する現用系、 DBサーバ28は障害の発生によりDBサーバ26が稼働を停止した場合に稼働が開始される待機系とされている。また、APサーバも冗長化され、APサーバ30,32が単一のクラスタを構成しており、APサーバ30は通常時に稼働する現用系、APサーバ32は障害の発生によりAPサーバ30が稼働を停止した場合に稼働が開始される待機系とされている。
The web
一方、図2に示すように、DBサーバ26及びAPサーバ30はサーバシャーシ42に搭載され、DBサーバ28及びAPサーバ32はサーバシャーシ44に搭載されており、DBサーバ26及びAPサーバ30には、サーバシャーシ42に搭載された電源部(図示省略)から電力が供給され、DBサーバ28及びAPサーバ32には、サーバシャーシ44に搭載された電源部(図示省略)から電力が供給される。
On the other hand, as shown in FIG. 2, the
また、サーバシャーシ42には2個のIOAモジュール46,48が搭載されている。IOAモジュール46,48には、DBサーバ26を光ファイバ経由でディスク装置56と接続するためのHBA(Host Bus Adapter)50Aと、APサーバ30を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ26をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ30をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ26及びAPサーバ30はIOAモジュール46,48に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。なお、HBA50A,50Bは請求項3,8に記載のホストアダプタの一例である。
In addition, two
また、サーバシャーシ44には2個のIOAモジュール56,58が搭載されている。IOAモジュール56,58には、DBサーバ28を光ファイバ経由でディスク装置56と接続するためのHBA50Aと、APサーバ32を光ファイバ経由でディスク装置56と接続するためのHBA50Bと、DBサーバ28をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Aと、APサーバ32をネットワーク14に接続するためのネットワークアダプタ(ネットワーク接続カード)52Bと、が各々設けられており、DBサーバ28及びAPサーバ32はIOAモジュール56,58に各々接続されている。また、個々のネットワークアダプタ52A,52Bには、各々2個のネットワーク接続デバイス(ネットワーク接続ボード)54A,54Bが取付けられている。
In addition, two
本実施形態に係るウェブサービス提供システム12では、ネットワーク接続デバイス54A,54BへのIPアドレスの割り当ての冗長化として、IOAモジュール46,48,56,58に設けられた全てのネットワーク接続デバイス54A,54BにIPアドレスが割り当てされる。
In the web
また、本実施形態では、各サーバ26〜32とネットワーク14との接続の冗長化として、サーバ1台当りネットワーク接続デバイス54が合計4個設けられ、2個1組のネットワーク接続デバイス54により、一方のネットワーク接続デバイス54を現用系、他方のネットワーク接続デバイス54を待機系とする単一の仮想的なネットワーク接続デバイスが構成され(ボンディング(bonding)という)、2個1組のネットワーク接続デバイス54から成る仮想的なネットワーク接続デバイスがサーバ1台当り2組設けられており、更に、単一の仮想的なネットワーク接続デバイスを構成する2個のネットワーク接続デバイス54として、異なるネットワークアダプタ52に取付けられたネットワーク接続デバイス54を用いている。
In the present embodiment, as a redundant connection between the
例えばDBサーバ28については、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Aと、によって単一の仮想的なネットワーク接続デバイスが構成されると共に、IOAモジュール46のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、IOAモジュール48のネットワークアダプタ52Aに取付けられているネットワーク接続デバイス54Bと、によって単一の仮想的なネットワーク接続デバイスが構成されている。
For example, with respect to the
一方、ディスク装置56は、ディスク駆動装置(DKU)58によって駆動される多数台のディスクドライブを備えている。多数台のディスクドライブは、各々冗長化された複数の論理ディスクを形成するように互いに接続されている。また、ディスク装置56にはディスク制御装置(DKC)60が設けられている。ディスク制御装置(DKC)60には冗長化された2個のクラスタ62A,62Bが設けられており、クラスタ62A,62Bの一方が現用系、他方が待機系とされている。個々のクラスタ62A,62Bには、各々複数個のチャネル・アダプタ(CHA)64が設けられたチャネル・アダプタ群66,68と、複数個のディスク・アダプタ(DKA)70が設けられたディスク・アダプタ群72と、チャネル・アダプタ群66,68の個々のチャネル・アダプタ(CHA)64とディスク・アダプタ群72の個々のディスク・アダプタ(DKA)70を接続するキャッシュ・スイッチ(CSW)74が各々設けられている。また、ディスク装置56には冗長化された一対の共有メモリ76A,76Bが設けられている。
On the other hand, the
ディスクドライブの個々の論理ディスクはクラスタ62A,62Bの何れか1つのディスク・アダプタ(DKA)70に各々接続されているが、本実施形態ではディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクは、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されている。
Each logical disk of the disk drive is connected to each one of the cluster adapters (DKA) 70 of the
また、個々のHBA50A,50Bは光ファイバケーブル78を介して何れかのチャネル・アダプタ(CHA)64と接続されているが、本実施形態では各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続するHBA50が冗長化されて2個設けられており(一方が現用系で他方が待機系)、当該2個のHBA50は互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されている。例えば、DBサーバ26をディスク装置56と接続する2個のHBA50Aのうち、IOAモジュール46に設けられたHBA50Aはクラスタ62Aのチャネル・アダプタ(CHA)64と接続されている一方、IOAモジュール48に設けられたHBA50Aはクラスタ62Bのチャネル・アダプタ(CHA)64と接続されている。
Each
なお、ディスク制御装置(DKC)60は請求項1〜3,8に記載のコントローラの一例であり、クラスタ62A,62Bは請求項2,8に記載の複数のコントローラの一例であり、ディスク・アダプタ(DKA)70は請求項2,3に記載の媒体側アダプタの一例であり、チャネル・アダプタ(CHA)64は請求項3に記載のホスト側アダプタの一例である。
The disk controller (DKC) 60 is an example of a controller according to
次に本実施形態の作用を説明として、ウェブサービス提供システム12を含むコンピュータ・システム10の管理者が、端末装置16からウェブサービス提供システム12の各サーバ26〜32に対して冗長化構成の検証を各々指示したことを契機として、各サーバ26〜32のCPU34で冗長化構成検証プログラムが実行されることによって実現される冗長化構成検証処理について、図3を参照して説明する。
Next, as an explanation of the operation of the present embodiment, the administrator of the
なお、管理者はウェブサービス提供システム12の構築が完了してウェブサービス提供システム12の稼働が開始される際に、マスタとして用いる状態情報の取得(後述)を目的として冗長化構成の検証を一度指示し、その後、例えばウェブサービス提供システム12を構成する一部のハードウェアの交換や一部の設定の変更、各サーバ26〜32にインストールされているプログラムのバージョンアップ等のように、ウェブサービス提供システム12の環境や一部構成が変更される度に、ウェブサービス提供システム12の冗長化部分が冗長化が有効に機能する状態を維持しているか否かを確認することを目的として、冗長化構成の検証を指示する。そして、各サーバ26〜32では、冗長化構成の検証が指示される都度、以下で説明する冗長化構成検証処理が行われる。
When the administrator completes the construction of the web
冗長化構成検証処理では、まずステップ100において、冗長化構成検証処理を前回実行した際に取得した状態情報を記憶部38の所定領域から削除する。なお、冗長化構成検証処理を最初に実行する際には、記憶部38の所定領域に状態情報が記憶されていないので、上記のステップ100の実行は省略される。次のステップ102では、自サーバ上で稼働しているOSに対し、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す情報を要求する所定のコマンドを送信する。
In the redundant configuration verification process, first, in step 100, the state information acquired when the redundant configuration verification process was executed last time is deleted from a predetermined area of the
OSは自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を保持しており、前記コマンドを受信すると自サーバが属するクラスタを構成しているサーバの台数及び識別情報を表す情報を読み出し、自サーバと同一のクラスタを構成している他のサーバの稼働状態については、読み出した情報に含まれる前記他のサーバの識別情報に基づき前記他のサーバ上で稼働しているOSに対して稼働状態を問い合わせ、例えば応答が無ければ前記他のサーバの稼働状態を「停止中」と判断し、応答を受信した場合は当該応答により通知された稼働状態に従って前記他のサーバの稼働状態を「稼働中」又は「待機中」と判断する。そしてOSは、判断した他のサーバの稼働状態を含む、自サーバが属するクラスタを構成しているサーバの台数及び稼働状態を表す情報を、冗長化構成検証プログラムへ引き渡す処理を行う。 The OS holds information indicating the number of servers constituting the cluster to which the server belongs and identification information. When the OS receives the command, the OS represents the number of servers constituting the cluster to which the server belongs and identification information. As for the operating status of other servers that read the information and constitute the same cluster as the own server, the OS running on the other server based on the identification information of the other server included in the read information For example, if there is no response, the operation status of the other server is determined as “stopped”. If a response is received, the operation of the other server is performed according to the operation status notified by the response. The status is determined as “in operation” or “standby”. Then, the OS performs processing for handing over the information indicating the number of servers constituting the cluster to which the server belongs and the operating status including the determined operating status of the other server to the redundancy configuration verification program.
冗長化構成検証処理では、上記情報がOSから引き渡されるとステップ104へ移行し、まず、引き渡された情報の中に実行の都度内容が相違する情報(例えば現在の日付や時刻等)が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、引き渡された情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項7に記載の第5状態情報の一例であり、ステップ102,104は請求項7に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above information is delivered from the OS, the process proceeds to step 104. First, the delivered information includes information (for example, the current date and time) whose contents differ every time it is executed. If the relevant information is included, the relevant information is deleted, and then the delivered information is stored in the
次のステップ106では、ディスク装置56のディスク制御装置(DKC)60に対し、自サーバに対応する2個のHBA50が光ファイバケーブル78を介して接続されているクラスタ62がクラスタ62A,62Bの何れであるかを表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bに設けられた個々のチャネル・アダプタ(CHA)64が何れのHBA50と接続されているかを表す情報を保持・管理しており、上記コマンドを受信すると、コマンド送信元のサーバに対応する2個のHBA50が何れのクラスタ62の何れのチャネル・アダプタ(CHA)64と接続されているかを表す情報を前記情報から抽出し、抽出した情報をコマンド送信元のサーバへ送信する。
In the next step 106, the cluster 62 in which the two HBAs 50 corresponding to the own server are connected to the disk control unit (DKC) 60 of the
冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ108へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば該当する情報を削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項8に記載の第6状態情報の一例であり、ステップ106,108は請求項8に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above information is received from the disk controller (DKC) 60, the process proceeds to step 108, and it is searched whether or not the received information includes information that differs in content every time it is executed. If the corresponding information is included, the corresponding information is deleted, and the received information is stored in the
続いてステップ110では、ディスク装置56のディスク制御装置(DKC)60に対し、クラスタ62A,62Bとディスク装置56の論理ディスクとの接続経路を、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を要求する所定のコマンドを送信する。ディスク制御装置(DKC)60は、クラスタ62A,62Bとディスク装置56の論理ディスクとが共有メモリ76A,76Bの何れを経由して接続されているかを、クラスタ62A,62Bに設けられた個々のディスク・アダプタ(DKA)70毎に表す情報を保持・管理しており、上記コマンドを受信すると上記情報をコマンド送信元のサーバへ送信する。
Subsequently, in
冗長化構成検証処理では、上記情報をディスク制御装置(DKC)60から受信するとステップ112へ移行し、受信した情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、受信した情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項1,2に記載の第1状態情報の一例であり、ステップ110,112は請求項1,2に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above information is received from the disk controller (DKC) 60, the process proceeds to step 112, and it is searched whether or not the received information includes information that differs in content every time it is executed. If the corresponding information is included, the received information is stored in the
次のステップ114では、自サーバ上で稼働しているパス管理ソフトに対し、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路及び稼働状態を管理する管理情報を要求する所定のコマンドを送信する。パス管理ソフトは、自サーバに対応する2個のHBA50からディスク装置56の論理ディスクに至る2本のパスについて、その経路(HBA50とチャネル・アダプタ(CHA)64の間、及び、ディスク・アダプタ(DKA)70と論理ディスクの間の各経路が重複していないか否か)及び稼働状態(例えば「稼働中」/「待機中」/「停止中」の何れか)を表す管理情報を保持・管理しており、上記コマンドを受信すると上記の管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。
In the next step 114, for the path management software running on the local server, the path and operating status of the two paths from the two HBAs 50 corresponding to the local server to the logical disk of the
冗長化構成検証処理では、上記の管理情報がパス管理ソフトから引き渡されるとステップ116へ移行し、引き渡された管理情報の中に実行の都度内容が相違する情報が含まれているか否かを探索し、該当する情報が含まれていれば削除した後に、引き渡された管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項1,3に記載の第2状態情報の一例であり、ステップ114,116は請求項1,3に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above management information is delivered from the path management software, the process proceeds to step 116, and it is searched whether or not the delivered management information includes information that differs in content every time it is executed. If the corresponding information is included, it is deleted, and the transferred management information is stored in the
続いてステップ118では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54に割り当てられているIPアドレスの通知を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々に割り当てられているIPアドレスをIPアドレス管理情報として保持・管理しており、上記コマンドを受信すると、上記のIPアドレス管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。 In step 118, a command requesting notification of IP addresses assigned to the four network connection devices 54 corresponding to the server is transmitted to the OS running on the server. The OS holds and manages the IP address assigned to each of all the network connection devices 54 corresponding to the server as IP address management information, and when the command is received, the IP address management information is made redundant. Performs processing to pass to the configuration verification program.
冗長化構成検証処理では、上記のIPアドレス管理情報がOSから引き渡されるとステップ120へ移行し、引き渡されたIPアドレス管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡されたIPアドレス管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項4,5に記載の第3状態情報の一例であり、ステップ118,120は請求項4,5に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above IP address management information is delivered from the OS, the process proceeds to step 120. If the delivered IP address management information includes information whose contents differ every time it is executed, After the information is deleted, the delivered IP address management information is stored in the
次のステップ122では、自サーバ上で稼働しているOSに対し、自サーバに対応する4個のネットワーク接続デバイス54が、各々何れのネットワークアダプタ52に割り当てられているかを表す情報を要求するコマンドを送信する。OSは自サーバに対応する全てのネットワーク接続デバイス54の各々が割り当てられているネットワークアダプタ52を表す割当管理情報を保持・管理しており、上記コマンドを受信すると、上記の割当管理情報を冗長化構成検証プログラムへ引き渡す処理を行う。 In the next step 122, a command for requesting information indicating which network adapter 52 each of the four network connection devices 54 corresponding to the own server is assigned to the OS running on the own server. Send. The OS holds and manages allocation management information representing the network adapter 52 to which each of the network connection devices 54 corresponding to the server itself is allocated. When the OS receives the command, the OS makes the allocation management information redundant. Performs processing to pass to the configuration verification program.
冗長化構成検証処理では、上記の割当管理情報がOSから引き渡されるとステップ124へ移行し、引き渡された割当管理情報の中に実行の都度内容が相違する情報が含まれていれば当該情報を削除した後に、引き渡された割当管理情報を状態情報としてメモリ36に記憶させる。なお、ここで状態情報として記憶される情報は請求項4,6に記載の第4状態情報の一例であり、ステップ118,120は請求項4,6に記載の取得手段による処理の一例である。
In the redundant configuration verification process, when the above allocation management information is delivered from the OS, the process proceeds to step 124, and if the delivered allocation management information includes information whose contents differ every time it is executed, the information is displayed. After the deletion, the transferred allocation management information is stored in the
次のステップ126では、ウェブサービス提供システム12における冗長化された他の部分の状態を表す状態情報を、前記他の部分の状態を管理する管理部(例えばOSやディスク制御装置(DKC)60、パス管理ソフト等のプログラム)に要求し、前記管理部から状態情報を受信してメモリ36に記憶させる処理を行う。なお、このステップ126で取得される状態情報の一例については後述する。
In the next step 126, status information indicating the status of the other redundant part in the web
次のステップ128では、今回の冗長化構成検証処理の実行が初回の実行(ウェブサービス提供システム12の稼働が開始される際の実行)か否か判定する。この判定は、記憶部38のうち状態情報のマスタを記憶するための所定の記憶領域に状態情報が記憶されているか否かを判定することで行うことができる。この判定が肯定された場合はステップ130へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、状態情報のマスタとして記憶部38の前記所定の記憶領域に記憶させ、冗長化構成検証処理を終了する。
In the
一方、ステップ128の判定が否定された場合はステップ132へ移行し、ステップ102〜ステップ126でメモリ36に記憶させた状態情報(今回の処理で取得した状態情報)を、その種別毎に、記憶部38の前記所定の記憶領域に記憶されている状態情報のマスタと比較し、マスタと不一致の状態情報があれば、その種別及び内容を抽出する。次のステップ134では管理者から指示された状態情報の出力対象を判定し、判定結果に応じてステップ136又はステップ138へ分岐する。
On the other hand, if the determination in
本実施形態において、状態情報の出力対象としては、今回の状態情報とマスタとの「比較結果」と状態情報の「全内容」を選択可能とされており、管理者が端末装置16を介し出力対象として「比較結果」を選択した場合には、ステップ134からステップ136へ移行し、例として図4(A)に示すように、状態情報の各項目毎に、今回の状態情報とマスタとの比較結果が一致していれば「○」を、不一致であれば「×」を表示すると共に、マスタと不一致の項目についてはその内容も表示した比較結果表示画面を生成し、生成した比較結果表示画面のデータを端末装置16へ送信することで、図4(A)に示すような比較結果表示画面を端末装置16のディスプレイ18に表示させる。
In the present embodiment, as the output target of the state information, “comparison result” between the current state information and the master and “all contents” of the state information can be selected, and the administrator outputs via the
先に説明したように、ウェブサービス提供システム12では、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化として、個々の論理ディスクが、クラスタ62Aの何れか1つのディスク・アダプタ(DKA)70と共有メモリ76Aを経由して接続されている一方、クラスタ62Bの何れか1つのディスク・アダプタ(DKA)70とは共有メモリ76Bを経由して接続されているが、例えば論理ディスク又は共有メモリ76又はディスク・アダプタ(DKA)70(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態に陥る可能性がある。
As described above, in the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ112で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、ディスク制御装置(DKC)60とディスクドライブ(論理ディスク)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。 On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 112 becomes inconsistent with the state information of the master. Will be notified. The administrator performs an operation to restore the state in which the redundancy of the connection between the disk controller (DKC) 60 and the disk drive (logical disk) functions effectively, so that the disk controller can be used when a failure occurs. Since the redundancy of the connection between the (DKC) 60 and the disk drive (logical disk) is not functioning effectively, a serious system failure is prevented from occurring.
また、ウェブサービス提供システム12では、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化として、各サーバ毎に2個のHBA50が設けられ、2個のHBA50からディスク装置56の論理ディスクに至る2本のパスが設けられているが、例えば一方のパスの経路上に存在する機器で障害が発生した等の場合、2本のパスの経路の一部が重複していたり、一方のパスの状態が「停止中」になっていたり等のように、サーバ26〜32の各々からディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態に陥る可能性がある。
Further, in the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ116で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかからディスク装置56の論理ディスクに至るパスの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。
On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the
また、ウェブサービス提供システム12では、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化として、各サーバ毎に4個設けられているネットワーク接続デバイス54の全てにIPアドレスを割り当てている(但し、単一の仮想的なネットワーク接続デバイスを構成する2個1組のネットワーク接続デバイス54には同一のIPアドレスが割り当てされる)が、例えば故障等により何れかのネットワーク接続デバイス54を交換した等の場合、交換後のネットワーク接続デバイス54に対してIPアドレスの割り当てが行われない等により、ネットワーク接続デバイス54へのIPアドレスの割り当ての冗長化が有効に機能しない状態(無効状態)に陥る可能性がある。
Further, in the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ120で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、IPアドレス未割り当てのネットワーク接続デバイス54に対してIPアドレスを割り当てさせる作業が行われることで、障害の発生時に、IPアドレス未割り当てのネットワーク接続デバイス54が存在していたことで、重大なシステム障害へ発展することが未然に防止される。 On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the previous step 120 becomes inconsistent with the state information of the master, thereby detecting that the state has fallen into the above state. Will be notified. Then, the administrator performs the work of assigning an IP address to the network connection device 54 to which the IP address is not assigned, so that the network connection device 54 to which the IP address is not assigned exists when a failure occurs. Therefore, it is possible to prevent a serious system failure from occurring.
また、ウェブサービス提供システム12では、各サーバ26〜32とネットワーク14との接続の冗長化として、互いに異なるネットワークアダプタ52に取付けられた2個1組のネットワーク接続デバイス54により単一の仮想的なネットワーク接続デバイスを構成しているが、例えばネットワーク接続デバイス54又はネットワークアダプタ52を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とネットワーク14との接続の冗長化が有効に機能しない状態に陥る可能性がある。
Further, in the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ124で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとネットワーク14との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとネットワーク14との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。
On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 124 becomes inconsistent with the state information of the master. Will be notified. Then, the administrator performs an operation to restore the state in which the redundancy of the connection between the corresponding server and the
更に、ウェブサービス提供システム12では、単一のクラスタを構成するサーバが冗長化され、DBサーバ26,28によって単一のクラスタが構成され、APサーバ30,32によって単一のクラスタが構成されているが、例えば待機系のサーバのハードウェアに故障が発生した等の場合、当該サーバの稼働状態が「待機中」から「停止中」へ変化することで、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態に陥る可能性がある。
Further, in the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ104で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、例えば故障したハードゥエアの交換する等により、稼働状態が「停止中」のサーバを「待機中」へ復旧させる作業が行われることで、障害の発生時に、単一のクラスタを構成するサーバの冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することが未然に防止される。 On the other hand, in this embodiment, when the state falls into the above state, the state information acquired in the previous step 104 becomes inconsistent with the state information of the master. Will be notified. Then, the administrator performs work to restore a server that is in a “stopped” state to “standby” by, for example, exchanging a failed hard air, so that a single cluster can be created when a failure occurs. Since the redundancy of the servers to be configured does not function effectively, a serious system failure can be prevented from occurring.
また、ウェブサービス提供システム12では、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化として、単一のサーバをディスク装置56と接続する2個のHBA50が互いに異なるクラスタ62のチャネル・アダプタ(CHA)64と接続されているが、例えばHBA50又はチャネル・アダプタ(CHA)64(或いはクラスタ62)を交換した等の場合、交換後の接続復旧作業のミス等により、各サーバ26〜32とディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態に陥る可能性がある。
In the web
これに対して本実施形態では、上記の状態に陥ると、先のステップ108で取得した状態情報がマスタの状態情報と不一致になることで、上記の状態に陥ったことが検知されて管理者に通知される。そして、管理者により、対応するサーバとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能する状態へ復旧させる作業が行われることで、障害の発生時に、サーバ26〜32の何れかとディスク装置56(ディスク制御装置(DKC)60)との接続の冗長化が有効に機能しない状態であったことで、重大なシステム障害へ発展することも未然に防止される。 On the other hand, in the present embodiment, when the state falls into the above state, the state information acquired in the previous step 108 becomes inconsistent with the state information of the master, so that it is detected that the state has fallen into the above state. Will be notified. Then, the administrator performs an operation to restore the state in which the redundancy of the connection between the corresponding server and the disk device 56 (disk control device (DKC) 60) functions effectively, so that when the failure occurs, the server Since the redundancy of the connection between any one of 26 to 32 and the disk device 56 (disk control device (DKC) 60) does not function effectively, it is possible to prevent a serious system failure from occurring. .
一方、管理者が状態情報の全内容の確認を所望している場合は、管理者により端末装置16を介し出力対象として状態情報の「全内容」が選択される。この場合はステップ134からステップ138へ移行し、例として図4(B)に示すように、状態情報の各項目毎に、マスタ及び今回の状態情報の内容を各々表示した内容表示画面を生成し、生成した内容表示画面のデータを端末装置16へ送信することで、図4(B)に示すような内容表示画面を端末装置16のディスプレイ18に表示させる。なお、ステップ134〜ステップ138は請求項9に記載の出力手段による処理の一例である。また、管理者による状態情報の比較結果又は全内容の確認が終了するとステップ140へ移行し、状態情報のマスタの更新が管理者から指示されたか否か判定する。通常はこの判定は否定され、冗長化構成検証処理を終了する。
On the other hand, when the administrator desires to confirm the entire contents of the status information, the administrator selects “all contents” of the status information as an output target via the
ところで、今回の状態情報がマスタと不一致になる原因としては、先に説明したように、接続復旧作業のミス等により、ウェブサービス提供システム12の何れかの部分の冗長化が有効に機能しない状態に陥った場合以外に、例えばウェブサービス提供システム12の仕様変更に伴い意図的に構成を変更した等の場合も考えられる。この場合、ウェブサービス提供システム12は以後、変更後の構成で運用されるので、管理者は状態情報のマスタの更新を指示する。この場合はステップ140の判定が肯定されてステップ142へ移行し、記憶部38の所定の記憶領域に記憶されている状態情報のマスタに上書きして今回の状態情報を記憶させ、冗長化構成検証処理を終了する。この場合は、今回の状態情報が以後、状態情報のマスタとして用いられることになる。
By the way, the reason why the current status information is inconsistent with the master is that, as described above, redundancy in any part of the web
次に、先に説明したステップ126で取得対象となる(又はその可能性がある)状態情報について説明する。冗長化された部分を有するコンピュータ・システムにおいて、その冗長化が有効に機能する状態を維持しているか否かの判定項目としては、ステップ102〜ステップ124で取得される状態情報を用いて実現可能な項目以外に、例えば次の表1に示す判定項目が挙げられる。
Next, the state information to be acquired (or possibly) in step 126 described above will be described. In a computer system having a redundant portion, it is possible to use the state information acquired in
上記各項目の判定を行う必要があるか否かは、検証対象のコンピュータ・システムにおける冗長化の構成によって個々の項目毎に相違しているので、検証対象のコンピュータ・システムに適した判定項目を予め選択しておき、選択した判定項目の判定が可能な状態情報を先のステップ126で取得するようにすればよい。 Whether or not each of the above items needs to be determined differs depending on the individual items depending on the redundancy configuration in the computer system to be verified. Therefore, a determination item suitable for the computer system to be verified is selected. It is only necessary to select in advance and obtain state information capable of determining the selected determination item in the previous step 126.
なお、検証対象のコンピュータ・システム10は図2に示した構成に限られるものではなく、本発明は冗長化された部分を有する任意のコンピュータ・システムに適用可能である。
Note that the
また、上記では検証対象のコンピュータ・システムとしてのウェブサービス提供システム12を構成するコンピュータ(サーバ26〜32)を本発明に係る冗長状態検証装置として機能させる態様を説明したが、これに限定されるものではなく、検証対象のコンピュータ・システムと接続された別のコンピュータを本発明に係る冗長状態検証装置として機能させることも可能である。
Moreover, although the above demonstrated the aspect which makes the computer (server 26-32) which comprises the web
また、上記では本発明に係る冗長化構成検証プログラムが各サーバ26〜32の記憶部38に予め記憶(インストール)されている態様を説明したが、本発明に係る冗長状態検証プログラムは、CD−ROMやDVD−ROM等の記録媒体に記録されている形態で提供することも可能である。
In the above description, the redundant configuration verification program according to the present invention is stored (installed) in advance in the
10 コンピュータ・システム
12 ウェブサービス提供システム
16 端末装置
18 ディスプレイ
26,28 DBサーバ
30,32 APサーバ
50A,50B HBA
52 ネットワークアダプタ
54A,54B ネットワーク接続デバイス
60 ディスク制御装置(DKC)
62A,62B クラスタ
64 チャネル・アダプタ(CHA)
70 ディスク・アダプタ(DKA)
10
52
62A,
70 Disk adapter (DKA)
Claims (11)
前記取得手段によって取得された前記状態情報を記憶する記憶手段と、
前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、
を含む冗長状態検証装置。 Whether the connection between the controller provided in the storage device and the storage medium main body of the storage device is made redundant by inquiring about the state of the redundant part in the computer system to be verified including the storage device First state information indicating whether or not, and second state information indicating whether or not the path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant Acquisition means for acquiring state information including;
Storage means for storing the status information acquired by the acquisition means;
By comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit, the redundancy of the computer system to be verified is obtained. Determining means for determining whether or not the portion maintains a state in which the redundancy functions effectively;
A redundant state verification device including:
前記取得手段は、前記コントローラに対し、複数の前記コントローラの各々と前記記憶装置の記憶媒体本体との間の接続経路を個々の前記媒体側アダプタ毎に表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第1状態情報として取得する請求項1記載の冗長状態検証装置。 The computer system to be verified is provided with a plurality of redundant controllers in the storage device as a redundant connection between the controller and the storage medium body, and a plurality of medium side adapters are provided in each of the controllers. Are provided, and for each of the plurality of controllers, each medium-side adapter is connected to the storage medium body via a different shared memory among a plurality of redundant shared memories. Yes,
The acquisition means transmits a command requesting information indicating the connection path between each of the plurality of controllers and the storage medium main body of the storage device for each of the medium-side adapters to the controller. The redundant state verification device according to claim 1, wherein the information is acquired from the controller as the first state information.
前記取得手段は、前記所定のプログラムに対し、前記検証対象のコンピュータ・システムの個々の前記ホストアダプタから前記記憶装置の記憶媒体本体に至る個々のパス毎の経路及び稼働状態を表す情報を要求するコマンドを送信することで、前記コントローラから前記情報を前記第2状態情報として取得する請求項1記載の冗長状態検証装置。 The computer system to be verified is provided with a plurality of redundant host adapters in the computer as a path redundancy between a computer of the computer system to be verified and a storage medium body of the storage device. A plurality of redundant host-side adapters connected to any of the plurality of host adapters to the controller of the storage device; and a storage medium body of the storage device connected to any of the plurality of host-side adapters A plurality of medium-side adapters connected to each other and made redundant, and a predetermined program operating on the computer is transferred from each host adapter of the computer system to be verified to a storage medium of the storage device It is a configuration that manages the route and operating status for each path to the main unit,
The acquisition means requests the predetermined program for information indicating a path and an operation state for each path from each host adapter of the computer system to be verified to the storage medium body of the storage device. The redundant state verification apparatus according to claim 1, wherein the information is acquired as the second state information from the controller by transmitting a command.
前記取得手段によって取得された前記状態情報を記憶する記憶手段と、
前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段と、
を含む冗長状態検証装置。 A state in which the IP address assignment to the network connection device is made redundant by inquiring about the current state of the redundant portion in the computer system to be verified including the computer connected to the network via the network connection device Third status information indicating whether or not, and fourth indicating whether or not the assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant Acquisition means for acquiring state information including state information;
Storage means for storing the status information acquired by the acquisition means;
By comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit, the redundancy of the computer system to be verified is obtained. Determining means for determining whether or not the portion maintains a state in which the redundancy functions effectively;
A redundant state verification device including:
前記取得手段は、オペレーティング・システムに対し、複数の前記ネットワーク接続デバイスの各々に割り当てられているIPアドレスを表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから前記情報を前記第3状態情報として取得する請求項4記載の冗長状態検証装置。 The computer system to be verified is provided with a plurality of network connection devices as a redundant IP address assignment to the network connection devices, and an IP address is assigned to each of the plurality of network connection devices. The configuration
The acquisition means transmits a command requesting information representing an IP address assigned to each of the plurality of network connection devices to the operating system, thereby obtaining the information from the operating system. The redundant state verification apparatus according to claim 4, which is acquired as state information.
前記取得手段は、オペレーティング・システムに対し、複数の前記ネットワーク接続デバイスの各々が何れのネットワークアダプタに割り当てられているかを表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから前記情報を前記第4状態情報として取得する請求項4記載の冗長状態検証装置。 The computer system to be verified is provided with a plurality of network connection devices as a redundancy of assignment of a plurality of network connection devices constituting a single network connection device to the network adapter. A plurality of network connection devices constituting a single network connection device are assigned to different network adapters,
The acquisition means transmits the command from the operating system to the operating system by sending a command requesting information indicating to which network adapter each of the plurality of network connection devices is assigned. The redundant state verification apparatus according to claim 4, which is acquired as the fourth state information.
前記取得手段は、オペレーティング・システムに対し、検証対象のコンピュータ・システムの単一のクラスタを構成するコンピュータの台数及びそれぞれの稼働状態を表す情報を要求するコマンドを送信することで、前記オペレーティング・システムから、前記情報を、前記検証対象のコンピュータ・システムの単一のクラスタが複数台のコンピュータで構成されている状態か否かを表す第5状態情報として取得する請求項1又は請求項4記載の冗長状態検証装置。 The computer system to be verified is a configuration in which a single cluster is composed of a plurality of computers as redundancy of computers constituting the cluster,
The acquisition unit transmits a command requesting information indicating the number of computers constituting a single cluster of the computer system to be verified and each operation state to the operating system. 5. The information according to claim 1, wherein the information is acquired as fifth status information indicating whether or not a single cluster of the computer system to be verified is configured by a plurality of computers. Redundant state verification device.
前記取得手段は、前記コントローラに対し、複数の前記ホストアダプタの各々が、複数の前記コントローラの何れに接続されているかを表す情報を要求するコマンドを送信することで、前記情報を、複数の前記ホストアダプタのうち対を成すホストアダプタが複数の前記コントローラのうちの異なる前記コントローラに接続されている状態か否かを表す第6状態情報として取得する請求項1又は請求項4記載の冗長状態検証装置。 The computer system to be verified includes a storage device, and a plurality of redundant host adapters are provided in the computer as a redundant connection between the computer of the computer system to be verified and the storage device. A pair of host adapters among the plurality of host adapters are connected to different controllers among a plurality of redundant controllers provided in the storage device,
The acquisition unit transmits the information to the controller by requesting information indicating which of the plurality of host adapters each of the plurality of host adapters is connected to. 5. The redundant state verification according to claim 1, wherein the redundant state verification is acquired as sixth state information indicating whether or not a pair of host adapters is connected to a different one of the plurality of controllers. apparatus.
前記検証対象のコンピュータ・システムにおける冗長化された部分の状態を問い合わせることで、前記記憶装置に設けられたコントローラと前記記憶装置の記憶媒体本体との接続が冗長化されている状態か否かを表す第1状態情報、及び、前記検証対象のコンピュータ・システムのコンピュータと前記記憶装置の記憶媒体本体との間のパスが冗長化されている状態か否かを表す第2状態情報を含む状態情報を取得する取得手段、
及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段
として機能させるための冗長状態検証プログラム。 A computer comprising a storage device, comprising a computer system to be verified or connected to the computer system to be verified, and comprising a storage means;
Whether or not the connection between the controller provided in the storage device and the storage medium body of the storage device is made redundant by inquiring about the state of the redundant portion in the computer system to be verified State information including first state information to be expressed and second state information to indicate whether or not a path between the computer of the computer system to be verified and the storage medium body of the storage device is redundant Acquisition means to acquire,
And the redundancy of the computer system to be verified by comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit A redundant state verification program for causing the determined portion to function as a determination unit that determines whether or not the redundancy is functioning effectively.
前記検証対象のコンピュータ・システムにおける冗長化部分の現在の状態を問い合わせることで、前記ネットワーク接続デバイスへのIPアドレスの割り当てが冗長化されている状態か否かを表す第3状態情報、及び、仮想的に単一のネットワーク接続デバイスを構成する複数の前記ネットワーク接続デバイスのネットワークアダプタへの割り当てが冗長化されている状態か否かを表す第4状態情報を含む状態情報を取得する取得手段、
及び、前記取得手段によって取得された前記状態情報を、前記取得手段によって過去に取得されて前記記憶手段に記憶された前記状態情報と比較することで、前記検証対象のコンピュータ・システムの前記冗長化された部分が、前記冗長化が有効に機能する状態を維持しているか否か判定する判定手段
として機能させるための冗長状態検証プログラム。 A computer comprising a computer system to be verified including a computer connected to a network via a network connection device or connected to the computer system to be verified and having a storage means,
Third state information indicating whether or not the assignment of the IP address to the network connection device is made redundant by inquiring about the current state of the redundant portion in the computer system to be verified; and virtual Acquisition means for acquiring state information including fourth state information indicating whether or not assignment of a plurality of network connection devices constituting a single network connection device to network adapters is made redundant;
And the redundancy of the computer system to be verified by comparing the state information acquired by the acquisition unit with the state information acquired in the past by the acquisition unit and stored in the storage unit A redundant state verification program for causing the determined portion to function as a determination unit for determining whether or not the state in which the redundancy is functioning effectively is maintained.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009292480A JP4902728B2 (en) | 2009-12-24 | 2009-12-24 | Redundant state verification device and program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009292480A JP4902728B2 (en) | 2009-12-24 | 2009-12-24 | Redundant state verification device and program |
Related Child Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2011286502A Division JP5216910B2 (en) | 2011-12-27 | 2011-12-27 | Redundant state verification device |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2011134070A true JP2011134070A (en) | 2011-07-07 |
| JP4902728B2 JP4902728B2 (en) | 2012-03-21 |
Family
ID=44346740
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009292480A Active JP4902728B2 (en) | 2009-12-24 | 2009-12-24 | Redundant state verification device and program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4902728B2 (en) |
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003167794A (en) * | 2001-11-29 | 2003-06-13 | Hitachi Ltd | SAN access path diagnostic system |
| JP2007310656A (en) * | 2006-05-18 | 2007-11-29 | Hitachi Ltd | Computer system and logical path difference detection method |
| JP2007334484A (en) * | 2006-06-13 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | Communication device and physical interface switching method of communication device |
-
2009
- 2009-12-24 JP JP2009292480A patent/JP4902728B2/en active Active
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003167794A (en) * | 2001-11-29 | 2003-06-13 | Hitachi Ltd | SAN access path diagnostic system |
| JP2007310656A (en) * | 2006-05-18 | 2007-11-29 | Hitachi Ltd | Computer system and logical path difference detection method |
| JP2007334484A (en) * | 2006-06-13 | 2007-12-27 | Nippon Telegr & Teleph Corp <Ntt> | Communication device and physical interface switching method of communication device |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4902728B2 (en) | 2012-03-21 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP4940967B2 (en) | Storage system, storage device, firmware hot replacement method, firmware hot swap program | |
| US7464236B2 (en) | Storage system and storage management method | |
| US7480780B2 (en) | Highly available external storage system | |
| JP4958673B2 (en) | Storage system and management method thereof | |
| EP1760591B1 (en) | System and method of managing access path | |
| JP4572250B2 (en) | Computer switching method, computer switching program, and computer system | |
| JP5486793B2 (en) | Remote copy management system, method and apparatus | |
| JP2005326935A (en) | Management server for computer system with virtualized storage and failure avoidance recovery method | |
| WO2014083598A1 (en) | Hierarchical storage system and file management method | |
| IE20000203A1 (en) | Storage domain management system | |
| US7937481B1 (en) | System and methods for enterprise path management | |
| US8234447B2 (en) | Storage control device for storage system provided with storage device coupled to switch network | |
| JP2007226400A (en) | Computer management method, computer management program, standby server for managing configuration of execution server, and computer system | |
| WO2015025358A1 (en) | Storage system and control method for storage system | |
| US20120047327A1 (en) | Disk array device and control method for the same | |
| JPWO2004104845A1 (en) | Storage system | |
| US20110047410A1 (en) | Redundant configuration method of a storage system maintenance/management apparatus | |
| JP2013117922A (en) | Disk system, data holding device, and disk device | |
| US20080288671A1 (en) | Virtualization by multipath management software for a plurality of storage volumes | |
| US7886186B2 (en) | Storage system and management method for the same | |
| JP2004341994A (en) | Program, information processing apparatus, and control method of information processing apparatus | |
| US8112598B2 (en) | Apparatus and method for controlling copying | |
| JP2009259031A (en) | Method of managing paths for externally-connected storage system and method of detecting fault site | |
| WO2013171865A1 (en) | Management method and management system | |
| US8583789B2 (en) | Computer system management method and management apparatus |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20111116 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20111206 |
|
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20111228 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 4902728 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20150113 Year of fee payment: 3 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
| S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
| R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |