[go: up one dir, main page]

WO2015072004A1 - 計算機、計算機制御方法、および計算機制御プログラム - Google Patents

計算機、計算機制御方法、および計算機制御プログラム Download PDF

Info

Publication number
WO2015072004A1
WO2015072004A1 PCT/JP2013/080850 JP2013080850W WO2015072004A1 WO 2015072004 A1 WO2015072004 A1 WO 2015072004A1 JP 2013080850 W JP2013080850 W JP 2013080850W WO 2015072004 A1 WO2015072004 A1 WO 2015072004A1
Authority
WO
WIPO (PCT)
Prior art keywords
failure
virtual machine
configuration control
virtual
machine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2013/080850
Other languages
English (en)
French (fr)
Inventor
光司 天野
崇博 大平
純 濱中
雅昭 小川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2015547344A priority Critical patent/JP6212131B2/ja
Priority to PCT/JP2013/080850 priority patent/WO2015072004A1/ja
Publication of WO2015072004A1 publication Critical patent/WO2015072004A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0706Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation the processing taking place on a specific hardware platform or in a specific software environment
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/0703Error or fault processing not based on redundancy, i.e. by taking additional measures to deal with the error or fault not making use of redundancy in operation, in hardware, or in data representation
    • G06F11/0793Remedial or corrective actions

Definitions

  • the present invention relates to a computer, a computer control method, and a computer control program.
  • Patent Document 1 stores operation information in which status information obtained from a system operated in accordance with the system definition is associated with an item of the system definition related to the status specified by the status information.
  • a technique for calculating an estimate for operating a system based on operation information when the system is operated is disclosed. As a result, it is possible to manage information such as the fault that has occurred and its related parts.
  • the cluster manager uses the virtual machine function to control the start and stop of each guest OS, monitor the service status, and when a service failure is detected, the cluster manager follows a preset failover policy.
  • a technique for recovering a corresponding service from a failure is disclosed.
  • Patent Document 1 provides the operation information to a plurality of configuration control units, and a plurality of configuration control units make configuration control determinations based on individual determination criteria for the same operation information. Difficult to do.
  • Patent Document 2 is a technique for recovering a failure by using a function of a virtual machine, in an environment in which a plurality of virtual machines having different policies are mixed, a configuration according to each policy It is difficult to control.
  • the service status information is recognized as a failure by a single policy, multiple guest / host configuration control units individually determine configuration control, and priorities are assigned to multiple failure determination results. It is difficult to perform configuration control. For example, a virtual machine that is related to a faulty part and a virtual machine that is not.
  • the physical machine has a failure type determination unit and a failure type management table, and identifies a virtual machine affected by a failure detected by the failure detection unit on the physical machine side and the failure detection unit on the virtual machine side.
  • the failure type determination unit notifies the failure information to the virtual machine that affects the failure, and invalidates the configuration control to the virtual machine in the physical machine configuration control unit in conjunction with the failure information.
  • the configuration control right of the configuration control unit in the physical machine is validated, and configuration control for the virtual machine is performed.
  • configuration control according to each policy is possible even in an environment where a plurality of virtual machines having different policies are mixed.
  • FIG. 1 is a system configuration diagram of Embodiment 1.
  • FIG. FIG. 4 is an example diagram of a system configuration information table 176.
  • FIG. 4 is an example diagram of a failure information management table 142. The figure which showed the system configuration information table 143.
  • the example figure of the failure classification management table 142 which a failure classification judgment part produces.
  • FIG. 6 is a sequence diagram showing activation of the virtualization server system 700.
  • FIG. 7 is a sequence diagram showing initialization of the virtual environment control unit 150.
  • FIG. 7 is a sequence diagram showing activation of a failure type determination unit 151.
  • FIG. 7 is a sequence diagram showing activation of a virtualization configuration control unit 152.
  • FIG. 7 is a sequence diagram showing failure part analysis and failure dependency analysis processing for a virtual machine by a failure type determination unit 151.
  • FIG. 6 is a sequence diagram illustrating determination of necessity of failure notification to a virtual machine and failure notification processing to a virtual machine.
  • FIG. 11 is a sequence diagram illustrating an example of failure site analysis by the failure type determination unit 151 and failure dependency analysis on a virtual machine for a failure detected in a virtual machine.
  • the flowchart figure which is a notification method of the failure information to another virtual machine.
  • FIG. 6 is a system configuration diagram of Embodiment 3.
  • FIG. 2 is an example diagram (1) of a control instruction queue.
  • FIG. 2 is a diagram (2) illustrating an example of a control instruction queue.
  • FIG. 4 is an example diagram of a system configuration information table 176.
  • the first embodiment is an example of supporting a complicated configuration in which a configuration control unit and its rules exist in each physical machine and virtual machine, which is a feature of the present invention.
  • the virtual machine 121A1 has a virtual side configuration control unit 124A1
  • the virtual machine 121B1 is an example for supporting both virtual machines that do not have a virtual side configuration control unit.
  • FIG. 1 is a system configuration diagram of the first embodiment.
  • the virtualization server system 700 includes a physical machine 100, which is connected to an external system via LANs 300 and 400.
  • the physical machine 100 is an example of a configuration of a physical machine that operates the virtual machine 121A1.
  • the physical machine 100 includes a processor 170, a memory 110, a disk interface 171, and communication interfaces 172 and 173. These devices are connected by a communication path 174.
  • the bus is specifically described as the communication path 174.
  • the physical machine 100 has a storage medium 175 outside the machine.
  • initial values of the system configuration information table 176 and the failure information management table 177 are recorded.
  • the memory 110 includes a virtual environment control unit 150, a failure type determination unit 151, a virtualization configuration control unit 152, and virtual NICs (Network Interface Cards) 153A and 153B necessary for operating the virtual server. And a virtual disk 154 is also included.
  • the memory 110 includes a disk interface driver 161 corresponding to the disk interface 171, a communication interface driver 162 corresponding to the communication interface 172, and a communication interface driver 163 corresponding to the communication interface 173.
  • a physical machine failure detection unit 160 that detects a hardware failure in a physical machine and a software failure running on the physical machine is provided.
  • the memory 110 also has a virtual machine / physical machine sharing information interface 130 as an interface for sharing information between the virtual machine and the physical machine.
  • the virtual machine / physical machine sharing information interface 130 uses the virtual machine / physical machine sharing memory partition 140 to transmit and receive information, but a communication path and a virtual device may also be used.
  • the virtual machine / physical machine shared memory partition 140 includes an occurrence failure information table 141, a failure type management table 142, and a system configuration information table 143.
  • the memory 110 includes a virtual machine logical partition 120A1, and forms a multiplex system paired with the virtual machine logical partition 220A2 that exists in the memory 210 of the physical machine 200.
  • the multiplex system means having a plurality of functions for executing the same target process.
  • a physical machine means that there are two physical machines.
  • a physical machine 100 that operates a virtual machine constituting a multiplex system forms a multiplex system with the physical machine 200.
  • the virtual machine logical partition 120A1 includes a virtual device driver 122A1, a virtual machine 121A1, a virtual side configuration control unit 124A1, a virtual machine failure detection unit 125A1, and a business application 126A1. Further, the virtual machine logical partition 120B1 is shown as an example of a general virtual machine having only business applications or a virtual machine adopting another company's architecture.
  • the virtual machine logical partition 120B1 includes a virtual device driver 122B1, a virtual machine 121B1, and a business application 126B1.
  • the virtual machine logical partition 120B1 may be a multiple system that is paired with the virtual machine logical partition 220A2 that exists in the memory 210 of the physical machine 200.
  • the memory 110 of the physical machine 100 may have an operating system for the physical machine, or may have a hypervisor or a microkernel.
  • the memory 110 includes a disk interface driver 161, communication interface drivers 162 and 163, a physical machine failure detection unit 160, a virtual machine / physical machine sharing information interface 130, a virtual machine / physical machine sharing memory partition 140, and an occurrence failure information table.
  • 141, the failure type management table 142, the system configuration information table 143, the virtual environment control unit 150, the failure type determination unit 151, the virtualization configuration control unit 152, and the like can be realized by being executed by the processor 170.
  • each control unit and processing unit is realized by a program developed on the memory, which is realized by the processor 170 executing each program.
  • Each processing unit will be described as a subject of processing.
  • System configuration information table --- 2 and 25 show an embodiment of the system configuration information table 176 in this embodiment.
  • the system configuration information table holds various parameters related to the system configuration.
  • a table (176-1) having correspondence information between the virtual server system identifier and the physical machine included in the virtual machine system identifier, correspondence information (176-2) between the physical machine identifier and the virtual machine identifier operated on the physical machine, The identifier for identifying the multi-system configuration and the correspondence information (176-3) of the physical machine that is the element, the identifier for identifying the multi-system configuration of the virtual machine and the correspondence information (176-4) of the virtual machine that is the element
  • FIG. 3 is a failure information management table showing an example of failures generally defined by the system.
  • a failure identifier created by each interface vendor This is an example of a failure identifier created by each interface vendor.
  • a communication interface failure identifier management table (177-1) and a disk interface failure identifier management table (177-2) are shown. Since these identifiers are created by each vendor, it is necessary to assign identifiers that can be associated with system configuration information in order to manage failure information.
  • FIG. 4 is a diagram showing a system configuration information table.
  • the system configuration information table includes an area (143-1) having static system configuration information (176) and dynamic system configuration information (143-2) constantly updated by the virtualization configuration control unit (152). Have The states of both the physical machine and the virtual machine are always updated by the virtualization configuration control unit 152. In the state of the physical machines 100 and 200 in the figure, the virtual machine identifier column is NULL.
  • FIG. 5 is a diagram showing a failure type management table created by the failure type determination unit.
  • the failure type determination unit acquires necessary information from the system configuration information table (177) and the failure information management table (178), and whether the location of the configuration control right for the failure is specified on the physical machine side. Information on whether to become the virtual machine side, whether or not it is necessary to notify each virtual machine of the failure, and the processing content for the failure are managed.
  • FIG. 6 is a diagram showing an occurrence failure information table (141) for sharing failure occurrence information between a virtual machine and a physical machine.
  • the destination where the failure delivery destination is stored can be specified not only on the virtual machine side but also on the physical machine side.
  • the shared information includes a failure identifier, contents, and an identifier in the system configuration definition of the failure target.
  • FIG. 7 is a sequence diagram showing activation of the virtualization server system 700.
  • the physical machine 100 is started (S701).
  • the virtual environment control unit 150 is activated (S702).
  • the physical machine 200 is activated (S703).
  • the virtual environment control unit 250 is activated (S704).
  • FIG. 8 is a sequence diagram showing initialization of the virtual environment control unit 150.
  • the virtual environment control unit 150 expands the disk interface driver 161 for the disk interface 171, the communication interface driver 162 for the communication interface 172, and the communication interface driver 163 for the communication interface 173 in the memory 110, so that the initial stage required for the physical machine to operate (S150-01)
  • the virtual environment control unit 150 reads the initial value from the storage medium 175 from the table 176-6 of the system configuration information table 176, the virtual machine / physical machine sharing information interface 130, and the virtual machine / physical machine sharing memory partition 140. Is activated (S150-02). The virtual environment control unit 150 expands the information in the system configuration information table 177 to 143-1 in the system configuration information table 143 (S150-03). Thereafter, the virtual environment control unit 150 activates the failure type determination unit 151 (S151-01). Details of this step will be described with reference to FIG. The virtual environment control unit 150 activates the virtualization configuration control unit 152 (S152-01). Details of this step will be described with reference to FIG.
  • FIG. 9 is a sequence diagram illustrating activation of the failure type determination unit 151.
  • the failure type determination unit 151 reads the failure information management table 177 from the system configuration information table (176-1 in 143-1) and the storage medium 175, and creates the failure type management table 142 (S151-02).
  • FIG. 10 is a sequence diagram illustrating activation of the virtualization configuration control unit 152. Here, an example is shown in which the virtual machine is activated when the virtualization configuration control unit 152 is activated.
  • the virtualization configuration control unit 152 generates a physical machine / virtual machine state management table 143-2, and starts collecting information on multiple pairs of physical and virtual machines (S152-02).
  • the virtualization configuration control unit 152 acquires parameters necessary for starting the virtual machine 121A1 from the system configuration information table 143-1 (S152-03). Thereafter, the virtualization configuration control unit 152 instructs the virtual environment control unit 150 to start the virtual machine start 121A1 (S152-04).
  • the virtual environment control unit 152 reads the monitoring timeout for preventing erroneous recognition at startup from the table 176-9 in the 143-1 and starts monitoring the virtual machine 121A1 (S152-05).
  • the virtual environment control unit 150 expands the virtual device driver 122A1 in the virtual machine logical partition 120A1, and performs initialization necessary for the virtual machine to operate (S152-06).
  • the virtual environment control unit 150 associates the disk interface 171 with the disk interface driver 161, the virtual disk 154, and the virtual device driver 122A1 based on the information in the system configuration information table 143 (S152-07).
  • the virtual environment control unit 150 associates the communication interface 172 with the communication interface driver 162, the virtual NIC 153A, and the virtual device driver 122A1 based on the information in the system configuration information table 143 (S152-08).
  • the virtual device driver 122A1 exists individually for each type of device, but in the description, it is associated with the same virtual device driver 122A1 for simplification.
  • the virtual environment control unit 150 starts the virtual machine 121A1 (S152-09). In the virtual machine 121A1, the virtual side configuration control unit 124A1, the virtual machine failure detection unit 125A1, and the business application 126A1 are sequentially started up (S152-10). The virtual side configuration control unit 124A1 starts responding to the inquiry from the virtual machine side virtualization configuration control 152 (S1521-1). The virtual environment control unit 152 reads the continuous monitoring timeout and the continuous monitoring period from the table 176-9 in the 143-1, starts monitoring the virtual machine 121A1, and sets the period and event in the system configuration information table 143-2. Update is started (S1522-1).
  • FIG. 11 shows authority linkage processing by the virtual side configuration control unit 124A1 and the physical machine side virtualization configuration control unit 152 at the time of failure.
  • a failure detected by the communication interface 172 is taken as an example of processing when a failure that can only be detected on a physical machine is detected.
  • the physical machine failure detection unit 160 notifies the failure type determination unit of a failure in the communication interface 172 (S150-10).
  • the failure part analysis by the failure type determination unit and the failure dependency on the virtual machine are analyzed (S151-10). Details of this step will be described with reference to FIG. Determination of necessity of failure notification to virtual machine and notification of failure to virtual machine (S151-20) Details of this step will be described with reference to FIG.
  • the failure type determination unit 151 notifies the virtualization configuration control unit 152 of the same information as the information registered in the failure occurrence information table 141 for notifying the virtual machine of the failure. (S150-11).
  • the virtualization configuration control unit 152 determines that the configuration control authority has been transferred to the virtual machine 124A1, and performs virtual side configuration control authority transfer timeout monitoring (S150-12). The virtual configuration controller 152 confirms the virtual side configuration controller response (S150-13). At this time, if there is a failure acceptance notification, invalidation of virtual machine monitoring on the physical side, master / subordinate mode change request, etc., invalidation of the virtualization configuration control unit authority on the physical machine side for the virtual machine 124A1 continues (S150). -15). With this process, the configuration control is performed after taking over the business data on the virtual machine side, and the virtual machine monitoring process or business process is stopped and the status information is saved when a failure occurs. It is possible to carry out at the judgment of the side.
  • configuration control cannot always be performed by the virtual side configuration control unit 124A1.
  • An example in which the virtual side configuration control is impossible is detected when the virtual side configuration control authority delegation timeout is reached.
  • the virtualization configuration control unit 152 considers that the virtual machine 124A1 is not in a state in which it can exercise the configuration control right, and the virtual machine configuration control unit on the physical machine side The authority of is activated (S150-17).
  • the virtualization configuration control unit 152 refers to the configuration control rules in the failure type management table 142-2 based on the failure information that has timed out, and performs configuration control (S150-18).
  • Failure information includes fatal information and failures that do not affect business applications. For example, since the control system has a redundant configuration such as a network, business can be continued even if a failure occurs. In such a case, the virtual side configuration control unit can return the authority of the virtualization configuration control unit 152 to valid. The authority of the virtualization configuration control unit 152 on the physical machine side is validated by the configuration control completion notification of the virtual side configuration control unit 124A1 (S150-16).
  • FIG. 12 is a sequence diagram illustrating failure part analysis and failure dependency analysis processing for a virtual machine by the failure type determination unit.
  • the failure type determination unit 151 searches the failure type management table 142-1 from the failure identifier included in the failure information and the identifier information in the system configuration definition (S151-11).
  • the failure type determination unit 151 refers to the “failure target” and the “failure level” from the failure type management table 142-1, and determines whether or not the failure type determination unit 151 can be processed only by the virtual machine configuration control unit 152 on the physical machine side. Judging. (S151-12).
  • the failure is defined as a failure that cannot be recognized, determined, or controlled in the virtual machine.
  • the virtualization configuration control unit 152 exercises the authority of configuration control, and performs configuration control based on the “configuration control rule” in the failure management table 142-1 (S151-14).
  • the failure is determined to be a level that can be determined on both the virtual machine side and the physical machine side, and the failure type determination unit 151 Searches for “failure dependency” in the failure type management table 142-2 from link 1 to link n until a virtual machine identifier is obtained, and identifies a virtual machine that affects the failure (S151-15).
  • the failure type determination unit 151 refers to the inter-virtual machine failure dependency item and determines whether the failure is a failure that affects the entire virtual machine (S151-16).
  • FIG. 13 is a sequence diagram illustrating determination of necessity of failure notification to the virtual machine and failure notification processing to the virtual machine.
  • the failure type determination unit 151 sets the virtual machine failure detection unit (125A1) as the “destination” as the “destination” and the “transmission source” according to “Necessity of failure notification to the virtual machine” (failure type determination unit ) 151 @ (physical machine) 100, the failure occurrence time in “failure occurrence time”, the failure type in “failure type”, the content of failure in “content”, and the “identifier in failure target system configuration definition” (
  • the virtual machine side identifier 153A associated with the communication interface 172 is registered via the virtual machine / physical machine sharing information interface 130 (S151-21).
  • identifier 172 in the system configuration definition of the physical communication interface can be recognized on the virtual machine side, 172 can be registered.
  • “Necessity notification of failure to virtual machine” is “necessary”, it means that the virtual side configuration control unit 124A1 on the virtual machine side has the authority to control the configuration.
  • “Necessity notification of failure to virtual machine” is (No)
  • the virtualization configuration control unit 252 on the physical machine side has the authority to control the configuration of the virtual machine. Means.
  • a method for sharing a failure detected by a virtual machine with a physical machine or another virtual machine will be described.
  • failure detection may be delayed.
  • An example of a disk failure in which this information is shared with a physical machine or another virtual machine is shown because a disk failure is first detected by a program that has read and written.
  • the virtual machine 121B1 in addition to the configuration of FIG. 1, also has a virtualization configuration control unit 224B1.
  • FIG. 15 shows additional information in the second embodiment for a virtual disk failure in the failure information management table 177.
  • the failure identifier manages the failure identifier in the physical machine and the failure identifier correspondence information in the virtual machine.
  • FIG. 16 shows additional information of the failure type management table 142 in the second embodiment.
  • the failure identifier manages the failure identifier in the physical machine and the failure identifier correspondence information in the virtual machine.
  • FIG. 17 shows information in the second embodiment of the failure type management table 142-2.
  • FIG. 18 shows information in the occurrence failure information table 141 in the second embodiment.
  • the first line is an example of a failure notification from the virtualization configuration control unit 124A1 on the virtual machine 121A1 side to the failure determination unit 151, and the failure identifier is set to EB that can be identified in the virtual machine.
  • the second line is an example of failure notification to the virtual machine failure detection unit 125B1 of the other virtual machine 121B1 by the failure determination unit 151 referring to 142-1b and associating with the failure in the physical machine.
  • FIG. 19 shows an example of authority cooperation by a virtual side configuration control unit and a physical machine side virtualization configuration control unit in an example in which a failure detected in a virtual machine is shared with a physical machine or another virtual machine.
  • the virtual machine failure detection unit 125A1 notifies the virtual side configuration control unit 124A1 of the failure of the virtual disk 154 (S124A1-01).
  • the virtual side configuration control unit 124A1 requests the virtualization configuration control unit 152 to invalidate the virtual configuration control unit authority on the physical machine via the virtual machine / physical machine shared information interface (S124A1-02).
  • the virtual side configuration control unit 124A1 sets the physical machine failure type determination unit (151) @physical machine (100) as “destination” and “sender” (virtual side configuration control unit) 124A1 @ (Virtual machine) 121A1 with "failure occurrence time", the failure occurrence time, “failure type”, the failure type, "content”, the failure content, and "failure target system configuration definition identifier" (virtual disk) 154 is registered through the virtual machine / physical machine sharing information interface 130 (S124A1-03). Fault information is acquired via the virtual machine / physical machine sharing information interface 130 (S151-30). Failure site analysis by the failure type determination unit, and The failure dependency analysis for the virtual machine is analyzed (S151-40). Details of this step will be described with reference to FIG. Determination of necessity of failure notification to virtual machine and notification of failure to virtual machine (S151-50) Details of this step will be described with reference to FIG.
  • FIG. 20 is a sequence illustrating an example of failure part analysis by the failure type determination unit and failure dependency analysis for a virtual machine for a failure detected in the virtual machine.
  • the failure type determination unit 151 searches the failure type management table 142-1b from the failure identifier included in the failure information and the identifier information in the system configuration definition (S151-41).
  • the failure type determination unit 151 refers to the “failure target” and “failure level” from the failure type management table 142-1b, and determines whether or not the failure type determination unit 151 can be processed only by the virtual machine configuration control unit 152 on the physical machine side. Is determined (S151-42).
  • the failure type determination unit 151 searches “failure dependency” in the failure type management table 142-2b from link 1 to link n until a virtual machine identifier is obtained, and identifies a virtual machine that affects the failure (S151- 15).
  • the failure type determination unit 151 refers to the inter-virtual machine failure dependency item and determines whether the failure is a failure that affects the entire virtual machine (S151-16).
  • FIG. 21 is an example of a failure information notification method to another virtual machine when a failure detected by a virtual machine is recognized as a common site failure by failure site analysis by the failure type determination unit. .
  • the failure type determination unit 151 determines whether or not the virtual machine failure detection unit (125B1) has a “destination” in the failure information table 141b according to “Necessity of failure notification to virtual machine” for virtual machines other than 121A1 that is the failure notification source. ) @Virtual machine (121B1) as “source” (failure type determination unit) 151 @ (physical machine) 100, “failure occurrence time”, failure occurrence time, “failure type” failure type, “ The contents of the failure are registered in the “content”, and the “virtual disk” 154 is registered in the “identifier in failure target system configuration definition” via the virtual machine / physical machine sharing information interface 130 (S151-51). It is confirmed whether transmission determination has been made for all virtual machines in the “notification required to virtual machine” column other than the failure notification source 121A1 (S151-52).
  • FIG. 22 includes a monitoring console A500 that monitors the physical machine 100, the physical machine 200, the virtual machine 121A1, and the virtual machine 221A2, and the physical machine 100, the physical machine 200, the virtual machine 121B1, and the virtual machine 221B2 in addition to the configuration of FIG. Has a monitoring table A600 to monitor.
  • the monitoring consoles 500 and 600 are examples of management of configuration control in a situation where only the state of the virtual machine managed by the monitoring consoles 500 and 600 is known and the state of other virtual machines is not known. This problem occurs when hardware resources are provided to different customers by virtualization.
  • the virtual machine / physical machine shared memory partition has a control instruction queue 144 for managing configuration control instructions.
  • FIG. 23 is a diagram showing a configuration control command in which the virtual-side configuration control unit 124A1 mechanically determines and issues configuration control upon failure detection, and a control command queue when a control command for the host is issued from the monitoring console B600. is there.
  • FIG. 24 shows the control instruction queue after the control instructions are arbitrated by the arbitration of the virtualization configuration controllers 152 and 252.
  • This function arbitrates configuration control from the virtual machines 121A1 to 221A2 and configuration control to the physical machine 200, and rejects a stop command for the physical machine 200 from the monitoring console 600.
  • Fig. 4 shows an extended function in configuration control rule setting in Examples 1 to 3.
  • the operator can change, add or delete configuration control rules, set configuration control rules for each virtual machine, and the like by issuing 142 rewrite commands to the failure type determination units 151 and 252.
  • the virtualization configuration control unit 152 is information in which the failure information table is not digested for the virtual machine / physical machine sharing information interface 130.
  • the virtual side configuration control unit 124A1 in the virtual machine can determine that configuration control is impossible by receiving information that is not in a state where failure information can be acquired by the virtual machine.
  • the virtual side configuration control unit 124A1 in the virtual machine determines that configuration control is not possible even by acquiring the information in the failure information table itself via the virtual machine / physical machine sharing information interface 130. It is possible to do.
  • the physical machine is 100 and the physical machine 200, the virtual machine 120A1 and the virtual machine 220A1, and the virtual machine 120B1 and the virtual machine 220B1 are physically separated.
  • the configuration information 143-2
  • the information of the partner machine is not always the latest. Therefore, the configuration control can be divided into two stages.
  • the configuration control process shown in FIG. 11 is transmitted as a configuration control plan to the physical machine 200 that accepts the configuration control.
  • the configuration control plan can be finally determined by transmitting a message received by the virtualization configuration control unit 252 in the physical machine 200 to the virtual workability control unit 152 of the physical machine 100.
  • the virtualization configuration control unit 252 does not accept or does not respond, it is possible to continue the processing without performing the configuration control.
  • the physical machine receives failure information, failure dependency information that is a range affected by the failure, a failure type management storage unit that stores the configuration control rules in association with each other, and a failure type management storage unit when the failure information is received.
  • the failure type determination unit that identifies the affected range of the failure based on the failure dependency information stored in the memory and the control to notify the affected range based on the configuration control rule, the physical range is included in the affected range.
  • the first virtual machine receives a notification and executes the configuration control when the first virtual machine is included in the affected range.
  • One virtual side configuration control unit is provided.
  • the failure type determination unit determines the range of influence due to the failure of the first virtual machine and the second virtual machine.
  • the virtualization configuration control unit identifies and notifies the first virtual machine and the second virtual machine, and the first virtual side configuration control unit of the first virtual machine and the second virtual machine first
  • the second virtual side configuration control unit may execute configuration control.
  • the configuration control unit of the physical machine may control the configuration of the virtual machine that has detected the timeout.
  • a third virtual machine is further provided, the physical machine failure type management storage unit is the first virtual machine and the second virtual machine is the first virtual side configuration control unit or the second virtual side configuration. It is a virtual machine having a control unit, the third virtual machine further stores that it is a virtual machine that does not have a configuration control unit, and the physical machine is the first virtual side configuration control unit or the second virtual machine Control notification may be sent to the first virtual machine or the second virtual machine having the virtual side configuration control unit.
  • the configuration control unit for the virtual machine of the physical machine may be invalidated.
  • the first virtual machine and the second virtual machine have a failure detection unit, notifies the failure information detected by the failure detection unit to the failure type determination unit of the physical machine, and the failure type determination unit of the physical machine
  • the virtualization configuration control unit may execute configuration control by detecting a failure range from the failure information.
  • the virtualization configuration control unit may execute configuration control when a plurality of physical machines are provided, the physical machine acquires the status of another physical machine, and the status can be configuration controlled.
  • a business application developed for a physical machine and a system management application can be operated in a virtual machine.
  • Fault information that can be detected only on a physical machine can be notified only to the affected virtual machine after identifying the affected virtual machine.
  • a failure detected in the virtual machine can identify another virtual machine affected by the failure on the physical machine and notify the failure.
  • Configuration control authority can be locked between in-machine configuration control functions.
  • Configuration control authority can be locked between in-machine configuration control functions.

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Hardware Redundancy (AREA)
  • Debugging And Monitoring (AREA)

Abstract

 仮想マシンを複数実行する物理マシン環境において、発生する障害が影響する仮想マシンを特定すること、仮想マシンに障害情報を通知すること、障害情報の通知と同期させ仮想マシン内構成制御機能と物理マシン内構成制御機能間で構成制御権限を排他できるようにする発明である。 物理マシンは、障害種別判断部と障害種別管理テーブルを有し、物理マシン側の障害検知部、及び仮想マシン側の障害検知部により検知された障害が影響する仮想マシンを特定する。障害種別判断部は障害に影響する仮想マシンへ障害情報を通知し、それと連動して物理マシン内構成制御部の当該仮想マシンへの構成制御を無効化する。当該障害が仮想マシン内の構成制御部で制御できないと判断した場合は、物理マシン内の構成制御部の構成制御権が有効化し、当該仮想マシンに対する構成制御が実施される。

Description

計算機、計算機制御方法、および計算機制御プログラム
 本発明は、計算機、計算機制御方法、および計算機制御プログラムに関するものである。
 従来、クライアントやサーバや、サーバ用マシンの多重系は物理マシンに各々構築され、物理マシン間は物理ネットワークによって通信経路を確立する構成になっている。特許文献1には、システム定義に沿って運用されているシステムから得られる状況情報に、その状況情報で特定される状況に関係するシステム定義の項目を関連させた稼動情報を記憶し、他のシステムを稼動する際に、稼動情報に基づいてシステムを稼動させる見積もりを算出する技術が開示されている。これにより、発生した障害などの情報とその関連部位を管理することができる。
 また、特許文献2には、クラスタマネージャは、仮想マシンの機能を利用し、各ゲストOSの起動、停止の制御、サービスの状態監視を行い、サービス障害を検知すると、予め設定されたフェイルオーバポリシーに従って該当サービスを障害から復旧する技術が開示されている。
特開2007-157026号公報 特開2008-52407号公報
 近年は、物理マシン用に開発した業務アプリや、システム管理アプリを仮想マシンにおいても稼動させたいというニーズがある。また、新規仮想マシンの構築では仮想マシン管理を物理マシンに任せ、構成制御に関わる仮想マシン内機能の開発工数の低減を実施したいというニーズがある。仮想マシンを集約する環境では、これら個別のポリシーを持った仮想マシンを共存させる事が必要となる。
 しかしながら、特許文献1に記載の技術は、その稼動情報を複数の構成制御部へ情報提供すること、その同一の稼動情報に対し、複数の構成制御部が個別の判断基準にて構成制御判断をすることが困難である。
 しかしながら特許文献2に記載の技術は、仮想マシンの機能を利用し、障害を復旧する技術であるため、別のポリシーをもった複数の仮想マシンが混在する環境では、それぞれのポリシーに応じた構成制御をすることは困難である。すなわち、単一のポリシーによってサービスの状況情報を障害と認定する方式であるため、複数のゲスト・ホストの構成制御部が個別に構成制御を判断すること、また複数の障害判定結果に優先順位をつけて構成制御を実行することなどが困難である。例えば、同一の故障部位であっても関係する仮想マシンとそうでない仮想マシン。可用性を重視し多重系ネットワークの方系が故障しても稼動している系を活用し業務を継続するポリシーと、安全性を重視し、多重系ネットワークから来た情報のコンペアが成立できない状況になると稼動しているネットワークの系があっても業務を停止させ、計算機の系を切り替えてしまうポリシーなど同一の障害情報に対する複数の制御判断が発生し、それを調停する必要が出てくる。
 また、障害に対する構成制御を判断する仮想マシン内の部位の障害という2重障害の検知ができない問題や、障害に対するログ処理やメモリダンプなど仮想マシン内の生死監視機能を停止させないと処理できない処理が実行されたときに、他系の仮想マシンや当該仮想マシンを稼動させている物理マシンが、仮想マシンが稼動していないと誤認識して構成制御を実行してしまう不具合が生じる。
 物理マシンは、障害種別判断部と障害種別管理テーブルを有し、物理マシン側の障害検知部、及び仮想マシン側の障害検知部により検知された障害が影響する仮想マシンを特定する。障害種別判断部は障害に影響する仮想マシンへ障害情報を通知し、それと連動して物理マシン内構成制御部の当該仮想マシンへの構成制御を無効化する。当該障害が仮想マシン内の構成制御部で制御できないと判断した場合は、物理マシン内の構成制御部の構成制御権が有効化し、当該仮想マシンに対する構成制御が実施される。
 本発明によれば、別のポリシーをもった複数の仮想マシンが混在する環境下でも、それぞれのポリシーに応じた構成制御が可能になる。
実施例1のシステム構成図。 システム構成情報テーブル176の例図。 障害情報管理テーブル142の例図。 システム構成情報テーブル143を示した図。 障害種別判断部が作成する障害種別管理テーブル142の例図。 発生障害情報テーブル141。 仮想化サーバシステム700の起動を示すシーケンス図。 仮想環境制御部150の初期化を示すシーケンス図。 障害種別判断部151の起動を示すシーケンス図。 仮想化構成制御部152の起動を示すシーケンス図。 障害時における仮想側構成制御部124A1、および物理マシン側仮想化構成制御部152による権限連携処理フローチャート図。 障害種別判断部151による障害部位解析および、仮想マシンへの障害依存解析処理について示したシーケンス図。 仮想マシンへの障害通知要否判断および、仮想マシンへの障害通知処理を示したシーケンス図。 実施例2のシステム構成図。 実施例2の障害情報管理テーブル177。 実施例2の障害種別管理テーブル142。 実施例2の障害種別管理テーブル142-2。 実施例2の発生障害情報テーブル141。 物理マシン側仮想化構成制御部152による権限連携フローチャート図。 仮想マシンで検出された障害に対する、障害種別判断部151による障害部位解析および、仮想マシンへの障害依存解析の例を示すシーケンス図。 別仮想マシンへの障害情報の通知方式であるフローチャート図。 実施例3のシステム構成図。 制御命令キューの例図(1)。 制御命令キューの例図(2)。 システム構成情報テーブル176の例図。
 以下の実施例において、同一の構造部を持ち、同一の符号を付した部分は、原則として同一の動作を行うため、重複する説明を省略する。
 ---システム構成---
 実施例1は、本発明の特長である物理マシン・仮想マシン各々に構成制御部、およびそのルールが存在する複雑な構成をサポートする一例である。実施例1は、仮想マシン121A1は仮想側構成制御部124A1を有し、仮想マシン121B1は仮想側構成制御部を有しない仮想マシン双方をサポートするための実施例である。
 図1は、実施例1のシステム構成図である。
 仮想化サーバシステム700は、物理マシン100を備えており、これらはLAN300及び400により、外部システムと連結している。
 物理マシン100は、仮想マシン121A1を稼動させる物理マシンの構成の一例である。物理マシン100は、プロセッサ170と、メモリ110と、ディスクインタフェース171、通信インタフェース172、及び173とを有している。これらの装置は通信路174で接続されている。ここでは具体的にバスを通信路174として説明する。
 物理マシン100は、マシン外部に、記憶媒体175を有している。記憶媒体175には、システム構成情報テーブル176、障害情報管理テーブル177の初期値を記録している。
メモリ110は、仮想サーバを稼動させるために必要な、仮想環境制御部150と、障害種別判断部151と、仮想化構成制御部152、仮想NIC(Network Interface Card)153A、153Bを有しており、また仮想ディスク154が含まれる。
 また、メモリ110は、ディスクインタフェース171に対応したディスクインタフェースドライバ161、通信インタフェース172に対応した通信インタフェースドライバ162、通信インタフェース173に対応した通信インタフェースドライバ163が含まれる。
 また、物理マシンでのハードウェアでの障害や物理マシン上で稼動するソフトウェア障害を検知する物理マシン障害検知部160を有する。
 また、メモリ110には、仮想マシンと物理マシンが情報を共有するためのインタフェースとして、仮想マシン・物理マシン共有用情報インタフェース130を有する。仮想マシン・物理マシン共有用情報インタフェース130は、仮想マシン・物理マシン共有用メモリ区画140を活用し情報を送受信するが、通信経路や仮想デバイスが活用される場合もある。
 仮想マシン・物理マシン共有用メモリ区画140は、発生障害情報テーブル141、障害種別管理テーブル142、システム構成情報テーブル143が含まれる。
  メモリ110には、仮想マシン用論理区画120A1があり、物理マシン200のメモリ210に存在する、仮想マシン用論理区画220A2と対を成した多重系を構成する。なお、多重系とは、同一の目的の処理を実行する機能を複数個持つことをいう。例えば、物理マシンなら物理マシンが2つ存在することをいう。多重系を構成する仮想マシンを稼動させる物理マシン100は、物理マシン200と多重系を構成している。
  仮想マシン用論理区画120A1は、仮想デバイスドライバ122A1、仮想マシン121A1、仮想側構成制御部124A1、仮想マシン障害検知部125A1、業務アプリ126A1を有する。
  また、仮想マシン論理区画120B1は業務アプリのみを搭載した一般的な仮想マシンや、他社アーキテクチャを採用した仮想マシンの例として示している。仮想マシン用論理区画120B1は、仮想デバイスドライバ122B1、仮想マシン121B1、業務アプリ126B1を有する。
  仮想マシン用論理区画120B1は、物理マシン200のメモリ210に存在する、仮想マシン用論理区画220A2と対を成した多重系とすることもできる。
  物理マシン100のメモリ110には一般的に、物理マシン用のオペレーティングシステムを有している場合もあるし、ハイパーバイザーやマイクロカーネルが存在する場合もある。
メモリ110には、ディスクインタフェースドライバ161、通信インタフェースドライバ162や163、物理マシン障害検知部160、仮想マシン・物理マシン共有用情報インタフェース130、仮想マシン・物理マシン共有用メモリ区画140、発生障害情報テーブル141、障害種別管理テーブル142、システム構成情報テーブル143、仮想環境制御部150、障害種別判断部151、仮想化構成制御部152、などの各処理はプロセッサ170で実行する事により実現できるが、これらは各処理を行なう処理部として集積回路化するなどしてハードウェアで実現する事ができる。
 以下、説明を簡単にするために、物理マシンについては、各制御部及び処理部の処理はメモリ上に展開されるプログラムによって実現するが、これらは各プログラムをプロセッサ170が実行する事で実現される各処理部を処理の主体として説明する。
 ---システム構成情報テーブル---
  図2及び図25は、システム構成情報テーブル176の本実施例における実施形態である。
システム構成情報テーブルでは、システムの構成に関わる各種パラメータを保持している。仮想サーバシステムの識別子とそれに含まれる物理マシンの対応情報を有する表(176-1)と、物理マシン識別子と当該物理マシンで稼動させる仮想マシン識別子の対応情報(176-2)と、物理マシンの多重系構成を識別する識別子と当該要素である物理マシンの対応情報(176-3)と、仮想マシンの多重系構成を識別する識別子と当該要素である仮想マシンの対応情報(176-4)と、物理マシン識別子と当該構成要素項目の対応情報(176-5)と、各種モジュールが通信をする際に使用する通信IF項目とIF識別子の対応情報(176-6)と、物理デバイスと仮想デバイスの対応情報(176-7)と、各種デバイスと当該対応ドライバの対応情報(176-8)と、仮想化構成制御部152が仮想マシンを監視する周期やタイムアウト等の定義情報(176-9)を有する。例えば定義情報には、仮想側、および物理側複数存在する構成制御部の連携のために、仮想側構成制御権限移譲タイムアウトを有する。また、多重系にて同時に検知する障害により相殺が発生しないようにするための多重系相殺防止用構成制御遅延時間を有する。
 ---障害情報管理テーブル---
  図3は、一般的にシステムが定義する障害の例を示した障害情報管理テーブル図である。
 各インタフェースベンダ等が作成した障害識別子の例である。通信インタフェースの障害識別子の管理テーブル(177-1)と、ディスクインタフェースの障害識別子の管理テーブル(177-2)を示す。これら識別子は各ベンダにより作成されるため障害情報を管理するためにはシステム構成情報と対応可能な識別子を付与する事が必要となる。
 ---システム構成情報テーブル---
  図4は、システム構成情報テーブルを示した図である。
 システム構成情報テーブルは、静的なシステム構成情報(176)を有する領域(143-1)及び、仮想化構成制御部(152)により常に更新されている動的なシステム構成情報(143-2)を有する。
  物理マシンと仮想マシン双方の状態が常に仮想化構成制御部152により更新される。図における物理マシン100および200自身の状態は仮想マシン識別子欄がNULLになっている。
 ---障害種別管理テーブル---
  図5は、障害種別判断部が作成する障害種別管理テーブルを示した図である。
 障害種別判断部は、システム構成情報テーブル(177)及び、障害情報管理テーブル(178)から必要な情報を取得し、障害の部位の特定と障害に対する構成制御権利の所在が物理マシン側にあるか仮想マシン側になるかの情報と障害を仮想マシン毎に通知する必要性があるか否かと障害に対する処理内容とを管理する。
 ---障害種別管理テーブル---
  図6は、障害発生情報を仮想マシン及び物理マシン間で共有する発生障害情報テーブル(141)を示した図である。テーブルには、障害の送達先が納めてある宛先は仮想マシン側の他、物理マシン側も指定可能である。共有情報として障害識別子、内容、障害対象のシステム構成定義内識別子が含まれている。
 ---起動シーケンス---
  図7は、仮想化サーバシステム700の起動を示すシーケンス図である。
仮想化サーバシステム700の起動は、物理マシン100を起動する(S701)。その後、仮想環境制御部150を起動する(S702)。同様に、物理マシン200を起動する(S703)。その後、仮想環境制御部250を起動する(S704)
 ---起動シーケンス---
  図8は、仮想環境制御部150の初期化を示すシーケンス図である。仮想環境制御部150は、ディスクインタフェース171用のディスクインタフェースドライバ161、通信インタフェース172用の通信インタフェースドライバ162、通信インタフェース173用の通信インタフェースドライバ163をメモリ110に展開し物理マシンが稼働に必要な初期化を実施する(S150-01)。
 仮想環境制御部150は、記憶媒体175より、システム構成情報テーブル176のテーブル176-6より初期値を読み込み、仮想マシン・物理マシン共有用情報インタフェース130、及び仮想マシン・物理マシン共有用メモリ区画140を起動する(S150-02)。
仮想環境制御部150はシステム構成情報テーブル177の情報をシステム構成情報テーブル143内の143-1に展開する(S150-03)。その後、仮想環境制御部150は障害種別判断部151を起動する(S151-01)本ステップの詳細は図9にて説明する。仮想環境制御部150は仮想化構成制御部152を起動する(S152-01)本ステップの詳細は図10にて説明する。
 ---起動シーケンス---
  図9は、障害種別判断部151の起動を示すシーケンス図である。
障害種別判断部151は、システム構成情報テーブル(143-1内176)と、記憶媒体175より、障害情報管理テーブル177を読み、障害種別管理テーブル142を作成する(S151-02)。
 ---起動シーケンス---
  図10は、仮想化構成制御部152の起動を示すシーケンス図である。ここでは、仮想化構成制御部152の起動時に仮想マシンも起動する例を示す。
 仮想化構成制御部152は、物理マシン・仮想マシン状態管理用テーブル143-2を生成し、物理、仮想マシンの多重系ペアの情報収集を開始する(S152-02)。仮想化構成制御部152は、仮想マシン121A1の起動に必要なパラメータをシステム構成情報テーブル143-1より取得する(S152-03)。その後、仮想化構成制御部152は、仮想環境制御部150に仮想マシンの起動121A1の起動を指示する(S152-04)。仮想環境制御部152は、143-1内のテーブル176-9より起動時誤認識防止用監視タイムアウトを読み込み、仮想マシン121A1の監視を開始する(S152-05)。仮想環境制御部150は、システム構成情報テーブル143の情報を基に、仮想デバイスドライバ122A1を仮想マシン論理区画120A1に展開し、仮想マシンが稼働に必要な初期化を実施する(S152-06)。仮想環境制御部150は、システム構成情報テーブル143の情報を基に、ディスクインタフェース171とディスクインタフェースドライバ161、仮想ディスク154と、仮想デバイスドライバ122A1を関連づける(S152-07)。
仮想環境制御部150は、システム構成情報テーブル143の情報を基に、通信インタフェース172と通信インタフェースドライバ162、仮想NIC153Aと仮想デバイスドライバ122A1を関連づける(S152-08)。
 仮想デバイスドライバ122A1は、デバイスの種類ごとに個別に存在するが、説明では簡単化のために同一の仮想デバイスドライバ122A1に関連づけている。
 仮想環境制御部150は、仮想マシン121A1を起動する(S152-09)。仮想マシン121A1内、仮想側構成制御部124A1仮想マシン障害検知部125A1、業務アプリ126A1が順次立ち上がる(S152-10)。仮想側構成制御部124A1が、物理マシン側の仮想化構成制御152の問い合わせに応答し始める(S152-11)。仮想環境制御部152は、143-1内のテーブル176-9より常時監視タイムアウト及び常時監視周期を読み込み、仮想マシン121A1の監視を開始し、システム構成情報テーブル143-2の周期、及びイベントでの更新を開始する(S152-12)。
 ---権限連携処理シーケンス---
  図11は、障害時における仮想側構成制御部124A1、および物理マシン側仮想化構成制御部152による権限連携処理を示す。本説明では、物理マシン上でしか検知できない障害を検知した場合の処理について通信インタフェース172で検知された障害を例とする。
 物理マシン障害検知部160より、通信インタフェース172の障害が障害種別判断部に通知される(S150-10)。障害種別判断部による障害部位解析および、仮想マシンへの障害依存を解析(S151-10)本ステップの詳細は図12にて説明する。仮想マシンへの障害通知要否判断および、仮想マシンへの障害を通知(S151-20)本ステップの詳細は図13にて説明する。障害種別判断部151は、仮想マシンに障害を通知するために障害発生情報テーブル141に登録した情報と同様の情報を、仮想化構成制御部152へ通知する。(S150-11)。仮想化構成制御部152は、構成制御権限が仮想マシン124A1に委譲されたと判断し、仮想側構成制御権限移譲タイムアウト監視を実施(S150-12)。仮想化構成制御部152による、仮想側構成制御部応答確認を実施する(S150-13)。このとき、障害受理通知や物理側での仮想マシン監視の無効化、主従系モード変更要求などがあれば、仮想マシン124A1に対する、物理マシン側の仮想化構成制御部権限の無効化継続する(S150-15)。この処理により、仮想マシン側で業務のデータの引継ぎ処理を実施した後構成制御を実施する事や、仮想マシン監視プロセスや業務プロセス等を停止して障害発生時の状況情報の保存処理を仮想マシン側の判断にて実施する事が可能となる。
 障害発生時は、必ずしも仮想側構成制御部124A1にて構成制御が実施できるとは限らない。仮想側構成制御が不可能状態について、仮想側構成制御権限委譲タイムアウトを迎えた事により検知する例を示す。仮想側構成制御権限委譲タイムアウトに達した場合(S150-1NO)、仮想化構成制御部152は、仮想マシン124A1が構成制御権を行使できる状態にないとみなし、物理マシン側の仮想化構成制御部の権限を有効化する(S150-17)。仮想化構成制御部152は、タイムアウトを迎えた障害情報を元に、障害種別管理テーブル142-2の構成制御ルールを参照し、構成制御を実施する(S150-18)。
 障害情報は致命的な情報や、業務アプリケーションにとって影響のない障害もある。例えば制御系ではネットワーク等冗長構成をなしているため、障害が発生しても業務を継続する事ができる。このような場合には仮想側構成制御部は、仮想化構成制御部152の権限を有効へ戻す事ができる。仮想側構成制御部124A1の構成制御完了通知により、物理マシン側の仮想化構成制御部152の権限を有効化する(S150-16)。
 ---障害依存解析処理シーケンス---
  図12は、障害種別判断部による障害部位解析および、仮想マシンへの障害依存解析処理について示したシーケンス図である。
  障害種別判断部151は、障害情報に含まれる障害識別子と、システム構成定義内識別子情報より、障害種別管理テーブル142-1を検索する(S151-11)。障害種別判断部151は、障害種別管理テーブル142-1より、“障害対象”及び”障害レベル”を参照し、物理マシン側の仮想化構成制御部152でのみ処理可能なレベルであるか否かを判断する。(S151-12)。
 “障害レベル”が物理となっている場合(S151-13がNO)、当該障害は、仮想マシン内では認識もしくは、判断、制御できない問題である障害と定める。仮想化構成制御部152が構成制御の権限を行使し、障害管理テーブル142-1の”構成制御ルール”に基づいた構成制御を実施する(S151-14)。”障害レベル“が選択可(仮想・物理)となっている場合(S151-13がYES)、当該障害は仮想マシン側、物理マシン側双方で判断できるレベルであると定め、障害種別判断部151は、障害種別管理テーブル142-2の”障害依存”をリンク1からリンクnにかけて、仮想マシン識別子を取得するまで検索し、当該障害に影響する仮想マシンを特定する(S151-15)。障害種別判断部151は、仮想マシン間障害依存項目を参照し、当該障害が仮想マシンに全体に影響する障害であるか否かを判断する(S151-16)。
 ---仮想マシンへの障害通知要否判断シーケンス---
  図13は、仮想マシンへの障害通知要否判断および、仮想マシンへの障害通知処理を示したシーケンス図である。障害種別判断部151は、”仮想マシンへの障害通知要否”に従い、発生障害情報テーブル141に、”宛先”として仮想マシン障害検知部(125A1)を、“送信元”として(障害種別判断部)151@(物理マシン)100を、”障害発生時刻”に障害発生時刻を、”障害種別”に障害種別を、”内容”に障害の内容を、“障害対象システム構成定義内識別子”に(通信インタフェース)172に関連付けた仮想マシン側識別子153Aを、仮想マシン・物理マシン共有用情報インタフェース130を介して登録する(S151-21)。
 仮想マシン側で物理通信インタフェースのシステム構成定義内識別子172を認識できる場合は、172を登録することも可能である。
ここで“仮想マシンへの障害通知要否”が、(要)となっている場合は、当該仮想マシン側にある仮想側構成制御部124A1が構成制御の権限を有する事を意味する。逆に“仮想マシンへの障害通知要否”が、(否)となっている場合は、当該仮想マシンに対しては、物理マシン側の仮想化構成制御部252が構成制御の権限を有する事を意味する。
 処理“仮想マシンへの通知要”欄全ての仮想マシンに対し送信判断(S151-21)を行ったか確認する(S151-22がYES)。
  実施例2では、仮想マシンで検知した障害を物理マシンや他の仮想マシンと共有する方法を説明する。。信頼性を向上させるために、稼動部分が含まれるディスクなどを極力使用しないようにプログラムされることが多く、その反面障害検知が遅れる場合がある。ディスク障害などは、読み書きを実施したプログラムが最初に検知するため、この情報を物理マシンや他の仮想マシンと共有するディスク障害の例を示す。
 ---システム構成---
  図14は、図1の構成に加え、仮想マシン121B1も仮想化構成制御部224B1を有する。
 ---障害情報管理テーブル---
  図15は障害情報管理テーブル177の仮想ディスク障害に対する実施例2における追加情報である。障害識別子には物理マシン内での障害識別子と仮想マシン内での障害識別子対応情報を管理している。
 ---障害種別管理テーブル---
  図16は障害種別管理テーブル142の実施例2における追加情報である。障害識別子には物理マシン内での障害識別子と仮想マシン内での障害識別子対応情報を管理している。
  図17は障害種別管理テーブル142-2の実施例2における情報である。
 ---発生障害情報テーブル---
  図18は発生障害情報テーブル141の実施例2における情報である。
一行目が仮想マシン121A1側の仮想化構成制御部124A1から、障害判断部151への障害通知例であり、障害識別子は仮想マシン内で識別できるE-Bが設定されている。
二行目は、障害判断部151が、142-1bを参照して物理マシンでの障害に対応付け、他仮想マシン121B1の仮想マシン障害検知部125B1への障害通知例である。
 ---権限連携処理シーケンス---
  図19は仮想マシンで検出した障害を物理マシンや他の仮想マシンと共有する例における仮想側構成制御部および物理マシン側仮想化構成制御部による権限連携例である。
  仮想マシン障害検知部125A1より、仮想ディスクの154の障害が仮想側構成制御部124A1に通知される(S124A1-01)。仮想側構成制御部124A1は、仮想マシン・物理マシン共有情報インタフェースを介して仮想化構成制御部152に、物理マシン側の仮想化構成制御部権限の無効化を要求(S124A1-02)。仮想側構成制御部124A1は、発生障害情報テーブル141bに、”宛先”として物理マシン障害種別判断部(151)@物理マシン(100)を、“送信元”として(仮想側構成制御部)124A1@(仮想マシン)121A1を、”障害発生時刻”に障害発生時刻を、”障害種別”に障害種別を、”内容”に障害の内容を、“障害対象システム構成定義内識別子”に(仮想ディスク)154を、仮想マシン・物理マシン共有用情報インタフェース130を介して登録する(S124A1-03)。仮想マシン・物理マシン共有用情報インタフェース130を介して障害情報を取得する(S151-30)。障害種別判断部による障害部位解析および、
仮想マシンへの障害依存解析する(S151-40)本ステップの詳細は図20にて説明する。
仮想マシンへの障害通知要否判断および、仮想マシンへの障害通知する(S151-50)本ステップの詳細は図21にて説明する。
 ---障害依存解析処理シーケンス---
  図20は、仮想マシンで検出された障害に対する、障害種別判断部による障害部位解析および、仮想マシンへの障害依存解析の例を示すシーケンスである。
 障害種別判断部151は、障害情報に含まれる障害識別子と、システム構成定義内識別子情報より、障害種別管理テーブル142-1bを検索する(S151-41)。障害種別判断部151は、障害種別管理テーブル142-1bより、“障害対象”及び”障害レベル”を参照し、物理マシン側の仮想化構成制御部152でのみ処理可能なレベルであるか否かを判断する(S151-42)。障害種別判断部151は、障害種別管理テーブル142-2bの”障害依存”をリンク1からリンクnにかけて、仮想マシン識別子を取得するまで検索し、当該障害に影響する仮想マシンを特定する(S151-15)。障害種別判断部151は、仮想マシン間障害依存項目を参照し、当該障害が仮想マシンに全体に影響する障害であるか否かを判断する(S151-16)。
 ---仮想マシンへの障害通知要否判断シーケンス---
  図21は、仮想マシンで検出された障害に対する、障害種別判断部による障害部位解析により、共通部位障害である事が認識されたときの、別仮想マシンへの障害情報の通知方式に対する例である。
 障害種別判断部151は、障害通知元である121A1以外の仮想マシンに対し、”仮想マシンへの障害通知要否”に従い、発生障害情報テーブル141bに、”宛先”として仮想マシン障害検知部(125B1)@仮想マシン(121B1)を、“送信元”として(障害種別判断部)151@(物理マシン)100を、”障害発生時刻”に障害発生時刻を、”障害種別”に障害種別を、”内容”に障害の内容を、“障害対象システム構成定義内識別子”に(仮想ディスク)154を、仮想マシン・物理マシン共有用情報インタフェース130を介して登録する(S151-51)。
  障害通知元である121A1以外の“仮想マシンへの通知要”欄全ての仮想マシンに対し送信判断を行ったか確認する(S151-52)。
  実施例3では、本発明の特長である物理マシン・仮想マシン各々に構成制御のルールが存在する複雑な構成をサポートに加え、各仮想マシンを監視する監視卓からも物理マシンに対する、起動や停止などの構成制御の操作がなされる例を示す。
 ---システム構成---
  図22は、図14の構成に加え、物理マシン100と物理マシン200と仮想マシン121A1と仮想マシン221A2を監視する監視卓A500と、物理マシン100と物理マシン200と仮想マシン121B1と仮想マシン221B2を監視する監視卓A600を有する。監視卓500と600は自らが管理する仮想マシンの状態のみを知っており、他の仮想マシンの状態を知らない状況での構成制御の管理例である。本問題は、別々の顧客にハードウェアリソースを仮想化にて提供する場合等に発生する問題である。
 仮想マシン・物理マシン共有メモリ区画には、構成制御命令を管理するための制御命令キュー144を有する。
 図23は、障害検知により機械的に仮想側構成制御部124A1が構成制御を判断発行した構成制御命令と、監視卓B600よりホストに対する制御命令が発行された場合の制御命令キューを表した図である。
 図24は、仮想化構成制御部152および252の調停により制御命令が調停された後の制御命令キューを示す。
 本機能により、仮想計算機121A1から221A2への構成制御と、物理マシン200への構成制御は調停され、監視卓600からの物理マシン200の停止命令は拒絶される。
 実施例1ないし3における、構成制御のルール設定における拡張機能を示す。オペレータは障害種別判断部151および252へ、142の書き換え命令を出すことによって、構成制御ルールの変更や追加、削除、仮想マシン毎の構成制御ルールの設定等が可能となる。
 さらに、実施例1ないし3における、仮想マシン内の仮想側構成制御部124A1が、構成制御が不可能な状態であると判定する方法の拡張機能を示す。仮想化構成制御部152は、仮想マシン・物理マシン共有用情報インタフェース130に対し、発生障害情報テーブルが消化されていない情報。つまり、仮想マシンにより障害情報が取得できる状態にない情報を受ける事で仮想マシン内の仮想側構成制御部124A1が、構成制御が不可能な状態であると判定する事が可能である。また、発生障害情報テーブルの情報そのものを仮想マシン・物理マシン共有用情報インタフェース130を介して取得する事でも仮想マシン内の仮想側構成制御部124A1が、構成制御が不可能な状態であると判定する事が可能である。
 実施例1ないし3における、物理マシンは100と物理マシン200、仮想マシン120A1と仮想マシン220A1、仮想マシン120B1と仮想マシン220B1は物理的に離れているため、自マシン内に存在する動的なシステム構成情報(143-2)のうち、相手のマシンの情報が最新であるとは限らない。そのため、構成制御を2段階に分けることが可能である。
図11に示す構成制御処理を構成制御計画案とし、構成制御受け入れを行う物理マシン200に送信する。物理マシン200内の仮想化構成制御部252が受理するメッセージを、物理マシン100の仮想加工性制御部152に送信することで構成制御計画案が最終決定することも可能である。
 また、仮想化構成制御部252が受理しない、もしくは応答しない場合は、構成制御を実施せず処理を継続することも可能である。
 すなわち、物理マシンは、障害情報と、障害が影響する範囲である障害依存情報と、構成制御ルールを対応づけて記憶する障害種別管理記憶部と、障害情報を受信した際、障害種別管理記憶部に記憶された障害依存情報に基づいて障害の影響範囲を特定する障害種別判断部と、構成制御ルールに基づいて、影響範囲に対して制御するように通知し、影響範囲に物理マシンが含まれていた場合、構成制御を実行する仮想化構成制御部を備え、第1の仮想マシンは、影響範囲に第一の仮想マシンが含まれていた場合、通知を受信し、構成制御を実行する第一の仮想側構成制御部を備える。
 また、第2の仮想マシンを更に備えた場合は、障害情報が物理マシンの障害情報であった場合、障害種別判断部は、第一の仮想マシン及び第二の仮想マシンの障害による影響範囲を特定し、仮想化構成制御部は、第一の仮想マシン及び第二の仮想マシンに、通知をし、第一の仮想マシンの第一の仮想側構成制御部及び、第二の仮想マシンの第二の仮想側構成制御部は、構成制御を実行しても良い。
 また、物理マシンは、第一の仮想マシン又は第二の仮想マシンのいずれか一つ又は、両方に、制御通知を送信した場合、第一の仮想マシン及び第二の仮想マシンの構成制御のタイムアウトを監視し、タイムアウトを検知したら、物理マシン側構成制御部によって、タイムアウトを検知した仮想マシンの構成制御を実施しても良い。
 また、更に第3の仮想マシンを備え、物理マシンの障害種別管理記憶部は、第1の仮想マシン及び第2の仮想マシンは、第1の仮想側構成制御部又は、第2の仮想側構成制御部を有する仮想マシンであり、第3の仮想マシンは、構成制御部を有していない仮想マシンである事を更に記憶し、物理マシンは、第1の仮想側構成制御部又は、第2の仮想側構成制御部を有する第1の仮想マシン又は第2の仮想マシンに制御通知をしても良い。
 また、物理マシンは、第1の仮想マシン又は第2の仮想マシンに制御通知を送信した場合、物理マシンの当該仮想マシンに対する構成制御部を無効にしても良い。
 また、第1の仮想マシン及び第2の仮想マシンは障害検知部を有し、障害検知部で検知された障害情報を物理マシンの障害種別判断部へ通知し、物理マシンの障害種別判断部は、障害情報から障害の範囲を検知し、仮想化構成制御部は、構成制御を実行しても良い。
 また、物理マシンを複数備え、物理マシンは、他の物理マシンの状況を取得し、状況が構成制御可能である場合に、仮想化構成制御部は、構成制御を実行しても良い。
 以上により、本発明によれば、物理マシン用に開発した業務アプリや、システム管理アプリを仮想マシンにおいても稼動させることが可能となる。物理マシン上でしか検知できない障害情報は、障害が影響する仮想マシンを特定したのち影響する仮想マシンにのみ障害を通知する事が可能となる。また、仮想マシン内で検知した障害も物理マシン上で障害が影響する別の仮想マシンが特定され、障害を通知することが可能となる。
 仮想マシン内にて構成制御を実施する場合は、物理マシン側の当該仮想マシンに対する構成制御を無効化する事を可能とし、これにより障害情報の通知と同期させて仮想マシン内構成制御機能と物理マシン内構成制御機能間で構成制御権限の排他が可能となる。
また、新規仮想マシンの構築では仮想マシン管理を物理マシンに任せる設定も可能となる。このように、個別のポリシーを持った仮想マシンを共存させる事が可能となる。
700 仮想化サーバシステム
100、200 物理マシン
300、400 LAN
170、270 プロセッサ
110,210 メモリ
171、271 ディスクインタフェース
172、173、272、273 通信インタフェース
174、274 通信路
175、275 記憶媒体
176 システム構成情報テーブル
177 障害情報管理テーブル
150、250 仮想環境制御部
151、251 障害種別判断部
152、252 仮想化構成制御部
153A、153B、253A、253B 仮想NIC
154、254 仮想ディスク
161、262 ディスクインタフェースドライバ
162、163、262、263 通信インタフェース
160、260 物理マシン障害検知部
130、230 仮想マシン・物理マシン共有用情報インタフェース
140、240 仮想マシン・物理マシン共有用メモリ区画
141、241 発生障害情報テーブル
142、242 障害種別管理テーブル
143、243 システム構成情報テーブル
120、220 仮想マシン用論理区画
121、221 物理マシン
122、222 仮想デバイスドライバ
124、224 仮想側構成制御部
125、225 仮想マシン障害検知部
126、226 業務アプリ
144、244 制御命令キュー
500、600 監視卓

Claims (9)

  1.  障害情報と、障害が影響する範囲である障害依存情報と、構成制御ルールを対応づけて記憶する障害種別管理記憶部と、
     前記障害情報を受信した際、前記障害種別管理記憶部に記憶された前記障害依存情報に基づいて障害の影響範囲を特定する障害種別判断部と、
     前記構成制御ルールに基づいて、前記影響範囲に対して制御するように通知し、
     前記影響範囲に物理マシンが含まれていた場合、構成制御を実行する仮想化構成制御部を備えた物理マシンと、
     前記影響範囲に第一の仮想マシンが含まれていた場合、前記通知を受信し、構成制御を実行する第一の仮想側構成制御部を備えた第一の仮想マシンと、
    を備えることを特徴とする計算機システム。
  2.  請求項1に記載の計算機システムであって、
     第二の仮想マシンを更に備え、
     前記障害情報が前記物理マシンの障害情報であった場合、
     前記障害種別判断部は、前記第一の仮想マシン及び前記第二の仮想マシンの前記障害による影響範囲を特定し、
     前記仮想化構成制御部は、前記第一の仮想マシン及び前記第二の仮想マシンに、前記通知をし、
     前記第一の仮想マシンの前記第一の仮想側構成制御部及び、前記第二の仮想マシンの前記第二の仮想側構成制御部は、構成制御を実行する計算機システム。
  3.  請求項2に記載の計算機システムであって、
     前記物理マシンは、
     前記第一の仮想マシン又は前記第二の仮想マシンのいずれか一つ又は、両方に、前記制御通知を送信した場合、前記第一の仮想マシン及び前記第二の仮想マシンの構成制御のタイムアウトを監視し、前記タイムアウトを検知したら、前記物理マシン側構成制御部によって、タイムアウトを検知した仮想マシンの構成制御を実施することを特徴とする計算機システム。
  4.  請求項3に記載の計算機システムであって、
     更に第三の仮想マシンを備え、
     前記物理マシンの障害種別管理記憶部は、前記第一の仮想マシン及び前記第二の仮想マシンは、前記第一の仮想側構成制御部又は、前記第二の仮想側構成制御部を有する仮想マシンであり、前記第三の仮想マシンは、構成制御部を有していない仮想マシンである事を更に記憶し、
     前記物理マシンは、前記第一の仮想側構成制御部又は、前記第二の仮想側構成制御部を有する前記第一の仮想マシン又は前記第二の仮想マシンに制御通知をすることを特徴とする計算機システム。
  5.  請求項4に記載の計算機システムであって、
     前記物理マシンは、前記第一の仮想マシン又は前記第二の仮想マシンに制御通知を送信した場合、前記物理マシンの当該仮想マシンに対する構成制御部を無効にすることを特徴とする計算機システム。
  6.  請求項2に記載の計算機システムであって、
     前記第一の仮想マシン及び第二の仮想マシンは障害検知部を有し、
     前記障害検知部で検知された障害情報を前記物理マシンの前記障害種別判断部へ通知し、
     前記物理マシンの前記障害種別判断部は、
     前記障害情報から障害の範囲を検知し、
     前記仮想化構成制御部は、
     構成制御を実行することを特徴とする計算機システム。
  7.  請求項6に記載の計算機システムであって、
     物理マシンを複数備え、
     前記物理マシンは、前記他の物理マシンの状況を取得し、
     前記状況が構成制御可能である場合に、
     前記仮想化構成制御部は、構成制御を実行することを特徴とする計算機システム。
  8.  物理マシンは、
     障害情報と、障害が影響する範囲である障害依存情報と、構成制御ルールを対応づけて予め障害種別管理記憶部に記憶し、
     前記障害情報を受信した際、前記障害種別管理記憶部に記憶された前記障害依存情報に基づいて障害の影響範囲を特定し、
     前記構成制御ルールに基づいて、前記影響範囲に対して制御するように通知し、
     前記影響範囲に物理マシンが含まれていた場合、構成制御を実行し、
     第一の仮想マシンは、
     前記影響範囲に第一の仮想マシンが含まれていた場合、前記通知を受信し、構成制御を実行する
    ことを特徴とする計算機制御方法。
  9.  障害情報と、障害が影響する範囲である障害依存情報と、構成制御ルールを対応づけて記憶する障害種別管理記憶部と、
     前記障害情報を受信した際、前記障害種別管理記憶部に記憶された前記障害依存情報に基づいて障害の影響範囲を特定する障害種別判断部と、
     前記構成制御ルールに基づいて、前記影響範囲に対して制御するように通知し、
     前記影響範囲に物理マシンが含まれていた場合、構成制御を実行する仮想化構成制御部を備えた物理マシンと、
     前記影響範囲に第一の仮想マシンが含まれていた場合、前記通知を受信し、構成制御を実行する第一の仮想側構成制御部を備えた第一の仮想マシンと、
    を備えることを特徴とする計算機制御プログラム。
PCT/JP2013/080850 2013-11-15 2013-11-15 計算機、計算機制御方法、および計算機制御プログラム Ceased WO2015072004A1 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2015547344A JP6212131B2 (ja) 2013-11-15 2013-11-15 計算機、計算機制御方法、および計算機制御プログラム
PCT/JP2013/080850 WO2015072004A1 (ja) 2013-11-15 2013-11-15 計算機、計算機制御方法、および計算機制御プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/080850 WO2015072004A1 (ja) 2013-11-15 2013-11-15 計算機、計算機制御方法、および計算機制御プログラム

Publications (1)

Publication Number Publication Date
WO2015072004A1 true WO2015072004A1 (ja) 2015-05-21

Family

ID=53056967

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/080850 Ceased WO2015072004A1 (ja) 2013-11-15 2013-11-15 計算機、計算機制御方法、および計算機制御プログラム

Country Status (2)

Country Link
JP (1) JP6212131B2 (ja)
WO (1) WO2015072004A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017017763A1 (ja) * 2015-07-27 2017-02-02 株式会社日立製作所 ストレージシステム、及び、記憶制御方法
US20180336351A1 (en) * 2017-05-22 2018-11-22 Microsoft Technology Licensing, Llc Isolated Container Event Monitoring
CN114662103A (zh) * 2022-03-16 2022-06-24 亚信科技(成都)有限公司 一种文件处理方法、装置及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099606A1 (ja) * 2006-02-28 2007-09-07 Fujitsu Limited プロセサ制御方法
JP2008269332A (ja) * 2007-04-20 2008-11-06 Hitachi Ltd サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
JP2010086516A (ja) * 2008-09-04 2010-04-15 Hitachi Ltd 仮想化環境において生じる障害の解析方法、管理サーバ、及びプログラム
WO2011083673A1 (ja) * 2010-01-08 2011-07-14 日本電気株式会社 構成情報管理システム、構成情報管理方法、及び構成情報管理用プログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4918668B2 (ja) * 2008-06-27 2012-04-18 株式会社日立システムズ 仮想化環境運用支援システム及び仮想化環境運用支援プログラム
JP5740338B2 (ja) * 2012-03-29 2015-06-24 株式会社日立ソリューションズ 仮想環境運用支援システム

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007099606A1 (ja) * 2006-02-28 2007-09-07 Fujitsu Limited プロセサ制御方法
JP2008269332A (ja) * 2007-04-20 2008-11-06 Hitachi Ltd サーバ仮想化環境におけるクラスタシステム構成方法及びクラスタシステム
JP2010086516A (ja) * 2008-09-04 2010-04-15 Hitachi Ltd 仮想化環境において生じる障害の解析方法、管理サーバ、及びプログラム
WO2011083673A1 (ja) * 2010-01-08 2011-07-14 日本電気株式会社 構成情報管理システム、構成情報管理方法、及び構成情報管理用プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017017763A1 (ja) * 2015-07-27 2017-02-02 株式会社日立製作所 ストレージシステム、及び、記憶制御方法
JPWO2017017763A1 (ja) * 2015-07-27 2018-04-05 株式会社日立製作所 ストレージシステム、及び、記憶制御方法
US20180336351A1 (en) * 2017-05-22 2018-11-22 Microsoft Technology Licensing, Llc Isolated Container Event Monitoring
US10885189B2 (en) * 2017-05-22 2021-01-05 Microsoft Technology Licensing, Llc Isolated container event monitoring
CN114662103A (zh) * 2022-03-16 2022-06-24 亚信科技(成都)有限公司 一种文件处理方法、装置及存储介质

Also Published As

Publication number Publication date
JPWO2015072004A1 (ja) 2017-03-09
JP6212131B2 (ja) 2017-10-11

Similar Documents

Publication Publication Date Title
US8423816B2 (en) Method and computer system for failover
JP5074274B2 (ja) 計算機システム及び通信経路の監視方法
US9600380B2 (en) Failure recovery system and method of creating the failure recovery system
US7992032B2 (en) Cluster system and failover method for cluster system
US7966386B2 (en) Controlling method, computer system, and processing program of booting up a computer
JP4733399B2 (ja) 計算機システム、計算機、ストレージ装置及び管理端末
US8438565B2 (en) Virtual machine migration managing method, computer using the method, virtualizer using the method and computer system using the method
US9235484B2 (en) Cluster system
US20160283261A1 (en) Information processing system, managing device, and computer readable medium
US20130103976A1 (en) Failure recorvery method
US20090070761A1 (en) System and method for data communication with data link backup
CN106980529B (zh) 基板管理控制器资源管理的电脑系统
US20100211717A1 (en) Computer system, method of managing pci switch, and management server
US9575855B2 (en) Storage apparatus and failure location identifying method
US20140204734A1 (en) Node device, communication system, and method for switching virtual switch
US20120054393A1 (en) Computer system, i/o device control method, and i/o drawer
US20130346584A1 (en) Control method for virtual computer, and virtual computer system
WO2012004902A1 (ja) 計算機システム及び計算機システムの系切替制御方法
JP6212131B2 (ja) 計算機、計算機制御方法、および計算機制御プログラム
US10089200B2 (en) Computer apparatus and computer mechanism
CN112637336B (zh) 一种虚拟机高可用实现方法、装置及存储介质
US20250363208A1 (en) Kernel monitoring based on hot adding a kernel monitoring device
JP5321658B2 (ja) フェイルオーバ方法、およびその計算機システム。
US20150154083A1 (en) Information processing device and recovery management method
JP2025118477A (ja) 監視装置、監視方法及びプログラム

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13897290

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015547344

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13897290

Country of ref document: EP

Kind code of ref document: A1