JP6511005B2 - Compute resource management system and compute resource management method - Google Patents
Compute resource management system and compute resource management method Download PDFInfo
- Publication number
- JP6511005B2 JP6511005B2 JP2016088514A JP2016088514A JP6511005B2 JP 6511005 B2 JP6511005 B2 JP 6511005B2 JP 2016088514 A JP2016088514 A JP 2016088514A JP 2016088514 A JP2016088514 A JP 2016088514A JP 6511005 B2 JP6511005 B2 JP 6511005B2
- Authority
- JP
- Japan
- Prior art keywords
- resources
- area
- resource
- service
- areas
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Alarm Systems (AREA)
- Mobile Radio Communication Systems (AREA)
Description
本発明は、コンピュートリソースの管理を行うコンピュートリソース管理システムおよびコンピュートリソース管理方法に関する。 The present invention relates to a compute resource management system and a compute resource management method for managing compute resources.
近年のキャリアサービスや金融サービスなどでは、激甚災害時にもサービスの継続が可能な高い品質が求められている。そのため、複数のエリアに複数のコンピュートリソースを分散して配置することが行われている。ここでコンピュートリソースとは、CPU(Central Processing Unit)、メモリ等から構成される情報処理能力を有する物理装置や、これら物理装置上に構築された仮想装置などであり、各種サービスを動作可能である。以下、コンピュートリソースを単に「リソース」と記載する。このリソースは、サービスの動作有無や特性により「空きリソース」と、「激甚対応有り使用中リソース」と、「激甚対応無し使用中リソース」とに大別される。 In recent career services and financial services, etc., a high quality that can continue the service even in severe disasters is required. Therefore, it has been practiced to distribute and arrange a plurality of compute resources in a plurality of areas. Here, a compute resource is a physical device having an information processing capability composed of a CPU (Central Processing Unit), a memory, etc., a virtual device built on these physical devices, etc., and can operate various services. . Hereinafter, compute resources are simply referred to as "resources". This resource is roughly classified into "vacant resource", "strongly available corresponding resource in use", and "strongly non-correspondence non-used resource" according to service operation existence and characteristics.
空きリソースとは、サービスが動作していないリソースのことをいう。激甚対応有り使用中リソースは、サービスが動作しており、かつ、このサービスを激甚災害時に救済する必要があるリソースのことをいう。激甚対応無し使用中リソースは、サービスが動作しており、かつ、このサービスを激甚災害時に救済する必要がないリソースのことをいう。サービス提供事業者は、各使用中リソースで動作するサービスを激甚災害時に救済する必要があるか否か、予め決定する。
激甚災害等で1箇所のエリアのリソースが全て使用不可となった場合、このエリアの使用中リソースで動作していたサービスを、他のエリアの空きリソースに移動させることで、この使用中リソースで動作していたサービスを救済することが行われている。これにより、激甚災害時にもサービスの継続が可能となる。なお、移動先のエリアは運用上の制約等により1箇所のエリアとする。これは、1つのエリアの複数の使用中リソースで動作していたサービスを、複数のエリアの空きリソースに分散して設定し、ネットワークを設定すると、復旧時間が容認できないほど大きくなってしまうためである。
An available resource is a resource in which a service is not operating. Intended response In-use resources are resources that the service is operating and need to be rescued in the event of a catastrophic disaster. Unresponsiveness In-use resources are resources that the service is operating and there is no need to rescue this service in the event of a catastrophe. The service provider decides in advance whether it is necessary to rescue a service operating on each in-use resource in the event of a catastrophe.
If all resources in one area become unavailable due to a catastrophe etc., move the service that was operating on the busy resource of this area to a vacant resource of another area, and this busy resource It has been done to rescue the service that was operating. This makes it possible to continue the service even in severe disasters. In addition, the area of the movement destination is one area due to operational restrictions and the like. This is because if services that were operating on multiple busy resources in one area are distributed to free resources in multiple areas and the network is set, recovery time will become unacceptably large. is there.
このような複数のリソースを連携する技術としてはOpenStackがある。OpenStackとは、多数のサーバコンピュータを一体的に運用して情報インフラを構築することができるソフトウェアである。OpenStackによれば、自社システムを運用するためのプライベートクラウドを構築し、またはパブリッククラウドを構築して顧客にクラウドサービスを提供することができる。 There is OpenStack as a technology to link such multiple resources. OpenStack is software that can operate a large number of server computers in an integrated manner to construct an information infrastructure. According to OpenStack, you can build a private cloud for operating your company system, or build a public cloud to provide cloud services to customers.
非特許文献1には、OpenStackのフィルタについて記載されている。フィルタのスケジューラは、新しいインスタンスが作成される場所での情報に基づいた意思決定を行うために、フィルタリングと重み付けをサポートする。
非特許文献2には、OpenStackにて計算ホストを予約する発明が記載されている。
Non-Patent
Non-Patent
サービス増設等のために新たに空きリソースを使用する場合、OpenStack等の既存技術では、激甚災害時に必要なリソースが考慮されない。そのため激甚発生時に備えたリソースが確保できなくなるおそれがある。
また、サービス増設等のために新たに空きリソースを使用する場合、激甚災害への対応の有無によってリソースの使用可否が異なる。そのため、「激甚発生時のリソースを確保」を最小限にするためには、サービス特性である激甚対応の有無を考慮に入れた使用可否判断を行う必要がある。
そこで、本発明は、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性を持たせることが可能なコンピュートリソース管理システムおよびコンピュートリソース管理方法を提供することを課題とする。
When newly available resources are used to expand services, etc., existing technologies such as OpenStack do not take into consideration the resources required in the event of a catastrophe. Therefore, there is a risk that resources prepared at the time of severe outbreak can not be secured.
Moreover, when using a free resource newly for service expansion etc., the availability of a resource changes with the presence or absence of the response to severe disaster. Therefore, in order to minimize the "resource securing at the time of a severe storm", it is necessary to make the availability judgment taking into consideration the presence or absence of the severe response which is the service characteristic.
Therefore, the present invention is to provide a compute resource management system and a compute resource management method capable of appropriately securing resources necessary for responding to a severe disaster occurrence and having service continuity in a severe disaster occurrence. It will be an issue.
前記した課題を解決するため、請求項1に記載の発明では、サービスが動作可能なリソースをそれぞれ備える複数のエリアを管理するコンピュートリソース管理システムであって、前記リソースは、激甚災害によるサービスの停止時に当該サービスの他のエリアへの移動を要する要救済リソースと、サービスが動作していない空きリソースとを含み、前記複数のエリアのうち一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定し、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が2以上ならば、前記一つのエリアが有する空きリソースにサービスを増設可能と判断する判断手段、を備えることを特徴とするコンピュートリソース管理システムとした。
In order to solve the above-mentioned subject, in the invention according to
このようにすることで、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性を持たせることができる。 By doing this, it is possible to appropriately secure the resources necessary for responding to a catastrophe, and to provide service continuity in the case of a catastrophe.
請求項2に記載の発明では、前記判断手段は、前記複数のエリアのうち前記一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定し、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が1かつ当該他のエリアが含む要救済リソースの数以上の空きリソースを有するエリアが存在したとき、前記一つのエリアが有する空きリソースにサービスを増設可能と判断する、ことを特徴とする請求項1に記載のコンピュートリソース管理システムとした。
In the second aspect of the present invention, the determination means includes, among the plurality of areas, an area including the largest number of required repair resources among the plurality of areas when a service is added to the vacant resources of the one area. Identify the number of the required rescue resources included in the area, and determine that the number of other areas having free resources greater than or equal to the number of the required rescue resources is 1 and the number of available rescue resources included in the other areas The computing resource management system according to
このようにすることで、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性とリソースの有効活用を両立するができる。 By doing this, it is possible to appropriately secure resources necessary for responding to a catastrophe, and to achieve both service continuity and effective use of resources in a catastrophe.
請求項3に記載の発明では、前記判断手段は、前記複数のエリアのうち空きリソースを含まないエリアが有ったならば、前記一つのエリアが有する空きリソースにサービスを増設不能と判断する、ことを特徴とする請求項1または2に記載のコンピュートリソース管理システムとした。
In the invention according to
このようにすることで、各エリアに空きリソースを確保して故障時の予備とすることができる。 By doing this, it is possible to reserve free resources in each area and make a reserve at the time of failure.
請求項4に記載の発明では、前記複数のエリアそれぞれが有する前記要救済リソースの数、および前記複数のエリアそれぞれが有する前記空きリソースの数を格納する記憶手段、を備えることを特徴とする請求項1ないし3のいずれか1項に記載のコンピュートリソース管理システムとした。
The invention according to
このようにすることで、システム間の通信を抑制しつつ短時間にサービスの増設可否を判断することができる。 By doing this, it is possible to determine whether or not to add a service in a short time while suppressing communication between systems.
請求項5に記載の発明では、前記判断手段が前記一つのエリアが有する空きリソースにサービスを増設可能と判断したならば、当該一つのエリアが有する空きリソースにサービスを増設する増設手段、を備えることを特徴とする請求項1ないし4のいずれか1項に記載のコンピュートリソース管理システムとした。
In the invention according to claim 5, when the determination means determines that the service can be added to the free resource possessed by the one area, the additional means adds the service to the free resource possessed by the one area. The compute resource management system according to any one of
このようにすることで、実際にサービスを増設することができる。 By doing this, it is possible to actually add services.
請求項6に記載の発明では、コンピュータが、サービスが動作していない空きリソース、およびサービスが動作中のリソースであり、激甚災害によるサービスの停止時に当該サービスの他のエリアへの移動を要する要救済リソースをそれぞれ備える複数のエリアを管理するコンピュートリソース管理方法であって、前記コンピュータが、前記複数のエリアのうち一つのエリアが有する空きリソースにサービスの増設指示を受け付けるステップと、前記一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定するステップと、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が2以上ならば、前記一つのエリアが有する空きリソースにサービスを増設可能と判断するステップと、を含むことを特徴とするコンピュートリソース管理方法とした。 In the invention according to claim 6 , the computer is a free resource in which the service is not operating and a resource in which the service is operating, and when the service is stopped due to a severe disaster, it is necessary to move the service to another area. A compute resource management method for managing a plurality of areas each provided with a rescue resource, wherein the computer receives an instruction to add a service to a vacant resource possessed by one of the plurality of areas, and the one area In the case where the service is added to the vacant resources possessed by: a step of specifying an area including the largest number of salvage resources among the plurality of areas and the number of the salvage resources included in the area; If the number of other areas with more free resources is 2 or more And a compute resource management method characterized by comprising the steps of: determining a possible additional services to the free resource that the one area has.
このようにすることで、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性を持たせることができる。 By doing this, it is possible to appropriately secure the resources necessary for responding to a catastrophe, and to provide service continuity in the case of a catastrophe.
請求項7に記載の発明では、前記コンピュータが、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が1かつ当該他のエリアが含む要救済リソースの数以上の空きリソースを有するエリアが存在したとき、前記一つのエリアが有する空きリソースにサービスを増設可能と判断するステップ、を含むことを特徴とする請求項6に記載のコンピュートリソース管理方法とした。 In the invention according to claim 7 , the computer has one or more free resources whose number of other areas having free resources equal to or more than the number of required rescue resources is one and the number of required relief resources included in the other areas. The computer resource management method according to claim 6 , further comprising the step of determining that a service can be added to the free resource of the one area when the area exists.
このようにすることで、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性とリソースの有効活用を両立するができる。 By doing this, it is possible to appropriately secure resources necessary for responding to a catastrophe, and to achieve both service continuity and effective use of resources in a catastrophe.
本発明によれば、激甚災害発生時の対応に必要なリソースを適切に確保し、激甚災害時のサービス継続性を持たせることが可能となる。 According to the present invention, it is possible to appropriately secure resources necessary for responding to a severe disaster and to provide service continuity in a severe disaster.
以降、比較例について各図を参照して詳細に説明したのち、本発明を実施するための形態を説明する。 Hereinafter, after a comparative example is demonstrated in detail with reference to each figure, the form for implementing this invention is demonstrated.
《比較例》
図4は、比較例のコンピュートリソース管理システムSaの構成図である。
比較例のコンピュートリソース管理システムSaは、コンピュートリソース管理装置1Aと、これに指示を行う保守者端末2と、管理対象であるエリア#1(3a)、エリア#2(3b)、エリア#3(3c)を含んで構成される。以下、エリア#1(3a)、エリア#2(3b)、エリア#3(3c)を特に区別しないときは、単にエリア3と記載する場合がある。コンピュートリソース管理システムSaは、例えば電話システムであるが、これに限られない。
Comparative Example
FIG. 4 is a block diagram of the compute resource management system Sa of the comparative example.
The compute resource management system Sa of the comparative example includes the compute
コンピュートリソース管理装置1Aは、例えばCPUとメモリ等から構成された装置であり、このCPUが不図示のコンピュートリソース管理プログラムを実行することにより、コンピュートリソース操作部12が具現化される。コンピュートリソース操作部12は、各エリア3のコンピュートリソースに対して増設/減設/移動などを指示するものである。このコンピュートリソース操作部12の処理の一部を、後記する図5で説明する。
The compute
コンピュートリソース情報13は、各エリア3が有するリソース情報をそれぞれ格納する記憶手段である。コンピュートリソース情報13については、後記する図7と図8で詳細に説明する。
The
エリア3は、サービスが動作可能なコンピュートリソースの集合であり、かつ激甚災害時において同時にコンピュートリソースの集合が使用不可となる範囲のことをいう。以下、コンピュートリソースのことを単にリソースという。リソースは、空きリソース31と、激甚対応有り使用中リソース32と、激甚対応無し使用中リソース33とに分けることができる。
空きリソース31は、サービスが動作していないリソースのことをいう。激甚対応有り使用中リソース32は、サービスが動作しているリソースであり、かつ、このサービスを激甚災害時に救済する必要があるもの(要救済リソース)をいう。激甚対応無し使用中リソース33は、サービスが動作しているリソースであり、かつ、このサービスを激甚災害時に救済する必要が無いものをいう。
The
図4にてエリア#1(3a)は、4個の空きリソース31と、1個の激甚対応有り使用中リソース32と、1個の激甚対応無し使用中リソース33とを含んでいる。エリア#2(3b)は、2個の空きリソース31と、4個の激甚対応有り使用中リソース32と、1個の激甚対応無し使用中リソース33とを含んでいる。エリア#3(3c)は、3個の空きリソース31と、1個の激甚対応有り使用中リソース32と、2個の激甚対応無し使用中リソース33とを含んでいる。
In FIG. 4, the area # 1 (3a) includes four
図5は、比較例のリソース増設処理を示すフローチャートである。
コンピュートリソース操作部12は、例えば保守者端末2からリソースの増設指示を受けると、一連のリソース増設処理を開始する。
最初、コンピュートリソース操作部12は、各エリア3に対して増設指示を行い(ステップS20)、増設指示結果をコンピュートリソース情報13にも反映させて(ステップS21)、図5の処理を終了する。
FIG. 5 is a flow chart showing resource addition processing of the comparative example.
For example, upon receiving an instruction to add a resource from the
First, the compute
図6は、激甚災害時のリソース移動処理を示すフローチャートである。
激甚災害等で1箇所のエリア3のリソースが全て使用不可となった場合は、他のエリア3の空きリソース31上でサービスを移動させて動作させる。具体的にいうと、コンピュートリソース操作部12は、激甚災害等を受けた1箇所のエリア3と、そのエリア3が有する激甚対応有り使用中リソース32の数とを特定する(ステップS30)。そして、コンピュートリソース操作部12は、特定した数以上の空きリソース31を有する他のエリア3の数を判定する(ステップS31)。
FIG. 6 is a flowchart showing resource migration processing at the time of a catastrophe disaster.
When all resources in one
コンピュートリソース操作部12は、他のエリア3の数が1以上ならば(ステップS31:1以上)、他のエリア3のうち1つを選択して、激甚災害等を受けたエリア3が有する激甚対応有り使用中リソース32で動作していたサービスを移動させる(ステップS32)。これにより、激甚災害時であっても激甚対応有り使用中リソース32で動作していたサービスを救済して継続させることができる。
If the number of
図7(a)〜(c)は、災害発生前の各エリア3の状態と、災害発生後にリソースを移動した各エリア3の状態とを説明する図である。図7(a)〜(c)は、コンピュートリソース情報13を示している。
図7(a)は、災害発生前の各エリア3の状態を示しており、図4に示したものと同一である。
FIGS. 7A to 7C are diagrams for explaining the state of each
FIG. 7A shows the state of each
図7(b)は、エリア#2(3b)にて災害発生後の、各エリア3の状態を示している。
エリア#2(3b)は、激甚災害の発生により空きリソース31と、激甚対応有り使用中リソース32と、激甚対応無し使用中リソース33とが全て0個に変化する。エリア#2(3b)の4個の激甚対応有り使用中リソース32で動作していたサービスは、エリア#1(3a)に移動する。
これにより、エリア#1(3a)の空きリソース31は4個から0個に、激甚対応有り使用中リソース32は1個から5個に変化する。これ以外は、図7(a)に示した状態と同様である。
なお、エリア#3(3c)も、図7(a)と同様に、3個の空きリソース31と、1個の激甚対応有り使用中リソース32と、2個の激甚対応無し使用中リソース33とを含んでいる。
FIG. 7B shows the state of each
In the area # 2 (3b), the
As a result, the
As in the case of FIG. 7A, area # 3 (3c) also has three
図7(c)は、図7(a)に示した災害発生前の状態からエリア#1(3a)にて災害発生した後の、各エリア3の状態を示している。
エリア#1(3a)は、激甚災害の発生により空きリソース31と、激甚対応有り使用中リソース32と、激甚対応無し使用中リソース33とが全て0個に変化する。エリア#1(3a)の1個の激甚対応有り使用中リソース32は、エリア#3(3c)に移動する。
エリア#3(3c)の空きリソース31は3個から2個に、激甚対応有り使用中リソース32は1個から2個に変化する。エリア#1(3a)は更に、2個の激甚対応無し使用中リソース33を有する。
なお、エリア#2(3b)は、図7(a)と同様に、2個の空きリソース31と、4個の激甚対応有り使用中リソース32と、1個の激甚対応無し使用中リソース33とを含んでいる。
FIG. 7C shows the state of each
In the area # 1 (3a), the
The
As in FIG. 7A, area # 2 (3 b) includes two
図8(a),(b)は、災害発生前後の各エリア3の状態を説明する図である。図8(a),(b)は、コンピュートリソース情報13を示している。
図8(a)は、災害発生前の各エリア3の状態を示している。
エリア#1(3a)は、図7(a)とは異なり、2個の空きリソース31と、1個の激甚対応有り使用中リソース32と、3個の激甚対応無し使用中リソース33とを含んでいる。つまり、図7(a)で示した状態において、2個の激甚対応無し使用中リソース33が増設されると、図8(a)で示した状態となる。
エリア#2(3b)は、図7(a)と同様に、2個の空きリソース31と、4個の激甚対応有り使用中リソース32と、1個の激甚対応無し使用中リソース33とを含んでいる。エリア#3(3c)は、3個の空きリソース31と、1個の激甚対応有り使用中リソース32と、2個の激甚対応無し使用中リソース33とを含んでいる。
FIGS. 8A and 8B are diagrams for explaining the state of each
FIG. 8A shows the state of each
Area # 1 (3a) differs from FIG. 7 (a) and includes two
Area # 2 (3 b) includes two
図8(b)は、エリア#2(3b)にて災害発生後の、各エリア3の状態を示している。
エリア#2(3b)は、激甚災害の発生により空きリソース31と、激甚対応有り使用中リソース32と、激甚対応無し使用中リソース33とが全て0個に変化する。しかし、エリア#2(3b)の4個の激甚対応有り使用中リソース32で動作していたサービスは、エリア#1(3a)にもエリア#3(3c)のいずれにも移動することができない。よってエリア#2(3b)の4個の激甚対応有り使用中リソース32で動作していたサービスは中断してしまう。
このように比較例では、サービスの増設を行った結果、激甚災害の発生時にサービスを救済できずに中断する事象が発生する。
FIG. 8B shows the state of each
In the area # 2 (3b), the
As described above, in the comparative example, as a result of the expansion of the service, an event occurs in which the service is interrupted without being able to be rescued when a severe disaster occurs.
《本実施形態》
図1は、本実施形態におけるコンピュートリソース管理システムSの構成図である。
本実施形態のコンピュートリソース管理システムSは、コンピュートリソース管理装置1と、これに指示を行う保守者端末2と、管理対象であるエリア#1(3a)、エリア#2(3b)、エリア#3(3c)を含んで構成される。
<< this embodiment >>
FIG. 1 is a block diagram of a compute resource management system S in the present embodiment.
The compute resource management system S according to the present embodiment includes the compute
コンピュートリソース管理装置1は、例えばCPUとメモリ等から構成された装置であり、このCPUが不図示のコンピュートリソース管理プログラムを実行することにより、増設判断部11とコンピュートリソース操作部12とが具現化される。増設判断部11は、各エリア3のリソースに対する増設の可否を判断するものである。コンピュートリソース操作部12は、各エリア3のリソースに対して増設/減設/移動などを指示するものである。この増設判断部11とコンピュートリソース操作部12の処理の一部を、後記する図2で説明する。
The compute
コンピュートリソース情報13は、各エリア3が有するリソース情報をそれぞれ格納する記憶手段である。このコンピュートリソース情報13により、増設判断部11は、各エリア3が有するリソースに問い合わせることなく、各リソースの状態を知ることができる。コンピュートリソース情報13については、後記する図3で詳細に説明する。
The
エリア3は、比較例と同様に、サービスが動作可能なコンピュートリソースの集合であり、かつ激甚災害時において同時にリソースの集合が使用不可となる範囲のことをいう。リソースが空きリソース31と、激甚対応有り使用中リソース32と、激甚対応無し使用中リソース33とに分けられるのも、比較例と同様である。
空きリソース31は、サービスが動作していないリソースのことをいう。激甚対応有り使用中リソース32は、サービスが動作しているリソースであり、かつ、このサービスを激甚災害時に救済する必要があるもの(要救済リソース)をいう。激甚対応無し使用中リソース33は、サービスが動作しているリソースであり、かつ、このサービスを激甚災害時に救済する必要が無いものをいう。
The
図2は、本実施形態におけるリソース増設処理を示すフローチャートである。
増設判断部11とコンピュートリソース操作部12は、例えば保守者端末2からリソースの増設指示を受けると、一連のリソース増設処理を開始する。
最初、増設判断部11は、不図示のRAM(Random Access Memory)等の作業領域にコンピュートリソース情報13のデータをコピーし(ステップS10)、増設指示の内容をこの作業領域に反映する(ステップS11)。次いで増設判断部11は、空きリソース31が無いエリア3の数を判定する(ステップS12)。増設判断部11は、空きリソース31が無いエリア3の数が1以上ならば(ステップS12:1以上)、保守者端末2にエラーを応答して(ステップS18)、図2の処理を終了する。これにより増設判断部11は、各エリア3が空きリソース31を有さない状態を防ぐことができる。これにより、各エリア3が有する激甚対応有り使用中リソース32および激甚対応無し使用中リソース33のうち何れか1個が故障等で停止しても、このリソースで動作していたサービスを空きリソース31で救済可能である。
FIG. 2 is a flowchart showing resource addition processing in the present embodiment.
For example, upon receiving an instruction to add a resource from the
First, the expansion judgment unit 11 copies the data of the
増設判断部11は、空きリソース31が無いエリア3の数が0ならば(ステップS12:0)、激甚対応有り使用中リソース32の数が最大となるエリア3と、その数とを特定する(ステップS13)。
If the number of
更に増設判断部11は、特定した激甚対応有り使用中リソース32の数以上の空きリソース31を有する他のエリア3の数を判定する(ステップS14)。増設判断部11は、他のエリア3の数が0ならば、保守者端末2にエラーを応答して(ステップS18)、図2の処理を終了する。増設判断部11は、他のエリア3の数が2以上ならば(ステップS14:2以上)、そのいずれかに対してコンピュートリソース操作部12に増設指示を行わせる(ステップS17)。
Further, the expansion determining unit 11 determines the number of
増設判断部11は、他のエリア3の数が1ならば(ステップS14:1)、空きリソース31が最大となるエリア3と、そのエリア3の激甚対応有り使用中リソース32の数とを特定する(ステップS15)。更に増設判断部11は、特定した激甚対応有り使用中リソース32の数以上の空きリソース31を有するその他のエリア3の数を判定する(ステップS16)。増設判断部11は、その他のエリア3の数が0ならば、保守者端末2にエラーを応答して(ステップS18)図2の処理を終了し、その他のエリア3の数が1以上ならば、コンピュートリソース操作部12に増設指示を行わせる(ステップS17)。
ステップS17の増設指示の後、増設判断部11は、作業領域に反映した増設指示結果をコンピュートリソース情報13にも反映させて(ステップS19)、図2の処理を終了する。
If the number of
After the expansion instruction in step S17, the expansion determination unit 11 reflects the expansion instruction result reflected in the work area on the compute resource information 13 (step S19), and ends the processing of FIG.
図3(a),(b)は、更新前と更新後の各エリア3を説明する図である。図3(a),(b)は、コンピュートリソース情報13が反映された作業領域を示している。以下の説明にて、適宜図1と図2を参照する。
図3(a)は、更新前の各エリア3の例を示しており、前記した図1の状態と同様である。
仮に、図2のステップS11にて増設指示内容を反映された作業領域が、図3(a)に示した状態であるとして、図2のステップS12以降の増設判断処理を行う。するとステップS13にて激甚対応有り使用中リソース32の数が最大となるエリア#2(3b)が特定され、その激甚対応有り使用中リソース32の数が4個として特定される。その後ステップS14にて、4個の激甚対応有り使用中リソース32を移動するため、4個以上の空きリソース31を有するエリア3がエリア#1(3a)として特定され、これに適合するエリア3は1個である。
FIGS. 3A and 3B are diagrams for explaining the
FIG. 3A shows an example of each
Assuming that the work area to which the content of the expansion instruction has been reflected in step S11 of FIG. 2 is in the state shown in FIG. 3A, the expansion determination process of step S12 and subsequent steps of FIG. 2 is performed. Then, in step S13, the area # 2 (3b) in which the number of in-
次いで増設判断部11は、空きリソース31が最大となるエリア3をエリア#1(3a)として特定し、このエリア#1(3a)の激甚対応有り使用中リソース32の数を1個と特定する(ステップS15)。増設判断部11は、1個以上の空きリソース31を有する他のエリア3の数を2個と判定するので、コンピュートリソース操作部12が増設指示を行うことができる(ステップS17)。
Next, the expansion judgment unit 11 specifies the
このとき、エリア#1(3a)、エリア#2(3b)、エリア#3(3c)のいずれか1つが激甚災害によって停止しても、停止したエリア3が有する激甚対応有り使用中リソース32で動作していたサービスを、他のエリア3の空きリソース31に移動可能である。
At this time, even if any one of area # 1 (3a), area # 2 (3b), and area # 3 (3c) is stopped due to a severe disaster, there is a severe response corresponding
図3(b)は、更新後の各エリア3の例を示している。ステップS11にて、増設指示内容を反映された作業領域が、図3(b)に示した状態となる。
ここでは、エリア#1(3a)に2個の激甚対応無し使用中リソース33が増設されたので、激甚対応無し使用中リソース33の数は3となり、空きリソース31の数は2となる。この作業領域に対して図2のステップS12以降の増設判断処理を行うと、ステップS13にて激甚対応有り使用中リソース32の数が最大となるエリア#2(3b)が特定され、その激甚対応有り使用中リソース32の数が4個として特定される。しかし、ステップS14にて、4個以上の空きリソース31を有するエリア3を特定しようとするが、これに適合するエリア3は存在せず、0個である。よって増設判断部11は、保守者端末2にエラーを応答する(ステップS18)。
FIG. 3B shows an example of each
Here, since two intense non-correspondence in-
ステップS18の後に処理を終了するので、各エリア3の実際の状態は、図3(a)に示した更新前のままである。このとき、エリア#1(3a)、エリア#2(3b)、エリア#3(3c)のいずれか1つが激甚災害によって停止しても、停止したエリア3が有する激甚対応有り使用中リソース32で動作していたサービスを、他のエリア3の空きリソース31に移動可能である。
このようにして本実施形態では、激甚災害の発生時にサービスを救済できるか否かを判断した後にサービス増設を行う。よって激甚災害発生時の対応に必要なリソースを必要最小限確保し、激甚災害時のサービス継続性とリソースの有効活用を両立することができる。
Since the process ends after step S18, the actual state of each
As described above, in the present embodiment, the service expansion is performed after it is determined whether or not the service can be rescued when the severe disaster occurs. Therefore, it is possible to secure minimum necessary resources for responding to the occurrence of a catastrophe, and to achieve both service continuity and effective use of resources in the case of a catastrophe.
(変形例)
本発明は、上記実施形態に限定されることなく、本発明の趣旨を逸脱しない範囲で、変更実施が可能であり、例えば、次の(a)〜(d)のようなものがある。
(a) リソースの数は3個に限られない。
(b) 各フローチャートは例であり、各ステップ中に他のステップが挿入されていてもよく、限定されない。
(c) 各リソースは物理装置であってもよく、また物理装置上に構成された仮想マシンであってもよい。
(d) 増設判断部11がリソースの増設指示を受けるのは、保守者端末2による指示に限られず、例えばZabbixやCeliometerなどが実行されている監視装置による指示であってもよく、限定されない。
(Modification)
The present invention is not limited to the above embodiment, and modifications can be made without departing from the spirit of the present invention, and there are, for example, the following (a) to (d).
(A) The number of resources is not limited to three.
(B) Each flowchart is an example, and another step may be inserted in each step, and is not limited.
(C) Each resource may be a physical device or may be a virtual machine configured on the physical device.
(D) The addition determination unit 11 receives an instruction to add a resource is not limited to the instruction from the
S,Sa コンピュートリソース管理システム
1,1A コンピュートリソース管理装置
11 増設判断部 (判断手段)
12 コンピュートリソース操作部 (増設手段)
13 コンピュートリソース情報 (記憶手段)
2 保守者端末
3a エリア#1
3b エリア#2
3c エリア#3
31 空きリソース
32 激甚対応有り使用中リソース (要救済リソース)
33 激甚対応無し使用中リソース
S, Sa Compute
12 Compute Resource Operation Unit (Additional means)
13 Compute resource information (storage means)
2
31
33 Extremely No Response In Use Resources
Claims (7)
前記リソースは、激甚災害によるサービスの停止時に当該サービスの他のエリアへの移動を要する要救済リソースと、サービスが動作していない空きリソースとを含み、
前記複数のエリアのうち一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定し、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が2以上ならば、前記一つのエリアが有する空きリソースにサービスを増設可能と判断する判断手段、
を備えることを特徴とするコンピュートリソース管理システム。 A compute resource management system for managing a plurality of areas each having a resource in which a service can operate, comprising:
The resources include relief resources that require the service to move to another area when the service is stopped due to a severe disaster, and free resources in which the service is not operating,
In the case where a service is added to a vacant resource included in one of the plurality of areas, an area including the largest number of required rescue resources among the plurality of areas and the number of the required rescue resources included in the area are specified. Determining means for determining that it is possible to add a service to the vacant resource possessed by the one area if the number of other areas having vacant resource more than the number of the rescue resources required is two or more,
A compute resource management system comprising:
前記複数のエリアのうち前記一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定し、前記要救済リソースの数以上の空きリソースを有する他のエリアの数が1かつ当該他のエリアが含む要救済リソースの数以上の空きリソースを有するエリアが存在したとき、前記一つのエリアが有する空きリソースにサービスを増設可能と判断する、
ことを特徴とする請求項1に記載のコンピュートリソース管理システム。 The judging means
Among the plurality of areas, when a service is added to a vacant resource included in the one area, an area including the largest number of necessary rescue resources among the plurality of areas and the number of the required rescue resources included in the area are specified If there is an area having one or more other resources having vacant resources equal to or more than the number of salvage required resources and one or more vacant resources equal to or more than the number of salvaged resources included in the other area, the one area Judging that it is possible to add services to the free resources it has,
The compute resource management system according to claim 1, characterized in that:
前記複数のエリアのうち空きリソースを含まないエリアが有ったならば、前記一つのエリアが有する空きリソースにサービスを増設不能と判断する、
ことを特徴とする請求項1または2に記載のコンピュートリソース管理システム。 The judging means
If there is an area that does not include free resources among the plurality of areas, it is determined that the service can not be added to the free resources possessed by the one area,
The compute resource management system according to claim 1 or 2, characterized in that:
を備えることを特徴とする請求項1ないし3のいずれか1項に記載のコンピュートリソース管理システム。 Storage means for storing the number of the required rescue resources in each of the plurality of areas, and the number of the free resources in each of the plurality of areas;
The compute resource management system according to any one of claims 1 to 3, comprising:
を備えることを特徴とする請求項1ないし4のいずれか1項に記載のコンピュートリソース管理システム。 Extension means for adding a service to the free resource possessed by the one area if the judging means judges that the service can be added to the free resource possessed by the one area;
The compute resource management system according to any one of claims 1 to 4, comprising:
前記コンピュータが、
前記複数のエリアのうち一つのエリアが有する空きリソースにサービスの増設指示を受け付けるステップと、
前記一つのエリアが有する空きリソースにサービスを増設した場合における前記複数のエリアのうち要救済リソースを最も多く含むエリアと当該エリアに含まれる当該要救済リソースの数とを特定するステップと、
前記要救済リソースの数以上の空きリソースを有する他のエリアの数が2以上ならば、前記一つのエリアが有する空きリソースにサービスを増設可能と判断するステップと、
を含むことを特徴とするコンピュートリソース管理方法。 A plurality of areas, each having a free resource where the service is not running, and a resource in which the service is running, and which need to be moved to another area of the service when the service is stopped due to a severe disaster It is a compute resource management method to manage, and
The computer
Accepting an instruction to add a service to a vacant resource included in one of the plurality of areas;
Specifying an area including the largest number of required rescue resources among the plurality of areas when a service is added to a vacant resource included in the one area, and the number of the required rescue resources included in the area;
Determining that it is possible to add a service to the free resource of the one area if the number of other areas having free resources equal to or more than the number of rescue resources required is 2 or more;
A compute resource management method comprising:
前記要救済リソースの数以上の空きリソースを有する他のエリアの数が1かつ当該他のエリアが含む要救済リソースの数以上の空きリソースを有するエリアが存在したとき、前記一つのエリアが有する空きリソースにサービスを増設可能と判断するステップ、
を含むことを特徴とする請求項6に記載のコンピュートリソース管理方法。 The computer
When there is an area having one or more other resources having vacant resources more than the number of rescue resources required and the number of vacant resources greater than or equal to the number of rescue resources contained in the other area, the vacant region included in one area Determining that services can be added to resources,
The method of claim 6 , further comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016088514A JP6511005B2 (en) | 2016-04-26 | 2016-04-26 | Compute resource management system and compute resource management method |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2016088514A JP6511005B2 (en) | 2016-04-26 | 2016-04-26 | Compute resource management system and compute resource management method |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2017199155A JP2017199155A (en) | 2017-11-02 |
| JP6511005B2 true JP6511005B2 (en) | 2019-05-08 |
Family
ID=60239374
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2016088514A Active JP6511005B2 (en) | 2016-04-26 | 2016-04-26 | Compute resource management system and compute resource management method |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP6511005B2 (en) |
Family Cites Families (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP5512442B2 (en) * | 2010-07-22 | 2014-06-04 | 株式会社インテック | Management device, method and program for disaster recovery system |
| JP5965781B2 (en) * | 2012-08-27 | 2016-08-10 | 株式会社エヌ・ティ・ティ・データ | Resource management apparatus, resource management method and program |
-
2016
- 2016-04-26 JP JP2016088514A patent/JP6511005B2/en active Active
Also Published As
| Publication number | Publication date |
|---|---|
| JP2017199155A (en) | 2017-11-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US12367120B2 (en) | Allocating hardware resources for virtual network function deployment at sites based on templates | |
| CN108683516B (en) | Application instance upgrading method, device and system | |
| US10749740B2 (en) | Deploying network-based cloud platforms on end equipment | |
| CN109669762B (en) | Cloud computing resource management method, device, equipment and computer readable storage medium | |
| CN108696581B (en) | Distributed information caching method and device, computer equipment and storage medium | |
| CN110289999B (en) | A data processing method, system and device | |
| US10798218B2 (en) | Environment isolation method and device | |
| US20160306710A1 (en) | Method and system for recovering virtual network | |
| WO2017020612A1 (en) | Container deployment method and apparatus | |
| US11153173B1 (en) | Dynamically updating compute node location information in a distributed computing environment | |
| EP3737039B1 (en) | Method for transmitting request message and apparatus | |
| CN109254876A (en) | The management method and device of database in cloud computing system | |
| EP2645635B1 (en) | Cluster monitor, method for monitoring a cluster, and computer-readable recording medium | |
| CN114925052A (en) | Method, device, equipment and computer readable medium for restarting database | |
| CN111988347A (en) | Data processing method of springboard system and springboard system | |
| JP2013117889A (en) | Wide area dispersion constitution alteration system | |
| US20130275546A1 (en) | Systems and methods for the automated migration from enterprise to cloud storage | |
| CN108228272A (en) | WEB containers generation processing method, equipment and server | |
| US11768704B2 (en) | Increase assignment effectiveness of kubernetes pods by reducing repetitive pod mis-scheduling | |
| JP6511005B2 (en) | Compute resource management system and compute resource management method | |
| KR20230069487A (en) | Method for determining of task transfer in multi-collaborative container platform | |
| CN114297033B (en) | A method, device, electronic device and storage medium for restoring application resources | |
| EP3387533B1 (en) | Disaster recovery of cloud resources | |
| US10855521B2 (en) | Efficient replacement of clients running large scale applications | |
| JP5781652B1 (en) | Stack management device, stack management method, and stack management program |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20180619 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20190222 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20190226 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20190315 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20190402 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20190405 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 6511005 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
| S533 | Written request for registration of change of name |
Free format text: JAPANESE INTERMEDIATE CODE: R313533 |
|
| R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |