[go: up one dir, main page]

JP2008158844A - 資源管理装置および方法 - Google Patents

資源管理装置および方法 Download PDF

Info

Publication number
JP2008158844A
JP2008158844A JP2006347461A JP2006347461A JP2008158844A JP 2008158844 A JP2008158844 A JP 2008158844A JP 2006347461 A JP2006347461 A JP 2006347461A JP 2006347461 A JP2006347461 A JP 2006347461A JP 2008158844 A JP2008158844 A JP 2008158844A
Authority
JP
Japan
Prior art keywords
resource
job
user device
network
resource management
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2006347461A
Other languages
English (en)
Inventor
Atsushi Taniguchi
篤 谷口
Yukio Chikushima
幸男 築島
Yasunori Samejima
康則 鮫島
Akira Hirano
章 平野
Kazuhisa Yamada
一久 山田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2006347461A priority Critical patent/JP2008158844A/ja
Publication of JP2008158844A publication Critical patent/JP2008158844A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

【課題】ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現する。
【解決手段】ジョブの種類を識別してジョブの実行に必要なネットワーク資源やコンピュータ資源の割当てを行う。このとき、ジョブの種類に対応したサービスクラスを示すジョブデータベースを参照することにより、ユーザ装置は、ジョブ識別情報を送るだけでジョブのサービスに応じた品質の資源の提供を受けることができる。
【選択図】図3

Description

本発明は、ユーザにネットワーク資源またはコンピュータ資源を提供する資源管理システムのスケジューリングの効率性を提供する技術に関する。
なお、本発明では、コンピュータ資源は、ネットワークに接続されたコンピュータ装置やサーバなどのジョブを実行する機能を有する資源を言い、ネットワーク資源は、ネットワーク上の伝送路またはこの伝送路に設定されるパスおよび当該パスを設定または管理する機能を有するノード装置を含み、コンピュータ資源相互間の接続を行うための資源のことを言う。また、単に「資源」と言えばコンピュータ資源およびネットワーク資源の双方あるいはいずれか一方を言うこととする。
分散コンピューティングシステム(分散システム)は、コンピュータや記憶装置、ネットワーク等の多様な資源から構成される。このためある仕事(ジョブ)に必要なサービス品質(QoS:Quality of Service)を得るためには複数の資源にわたってサービス品質を保証するような資源管理技術が必要となる。
特に、独立して管理される複数ドメイン間で資源を共有するようなグリッドコンピューティングではシステム全体の資源を一元的に管理することが許容されないことが多い。この種のシステムでは複数の独立した資源管理機構を利用したQoS保証機能が必要になる。
分散システムにおいてQoSを保証する従来の機能として、資源の事前予約が知られている。事前予約とはジョブの実行に必要な個々の資源において一定の時間帯にQoSを保証する操作である。
図1および図2に従来の資源管理システムを示している(例えば、特許文献1参照)。図1は従来の資源管理システムの全体構成図である。図2は従来の資源管理装置とユーザ装置との間での通信手順を示すシーケンス図である。ユーザ装置1は資源管理装置2に予約要求を行う(S1)。予約が空いている場合は予約証明書をユーザ装置1に発行する(S2)。予約した時間に達すると資源管理装置2は、ユーザ装置1に対してコンピュータ資源3およびネットワーク資源4を提供し(S3)、これによりユーザ装置は、ネットワーク資源4を介してコンピュータ資源3を利用できる。
また、ユーザ装置1がジョブの開始時刻および終了時刻をグリッドスケジューラに入力することでグリッドスケジューラは資源管理装置2に資源を予約しジョブを実行させるグリッドサービスNW(ネットワーク)の実験が行われている(例えば、非特許文献1参照)。
従来の技術ではユーザ装置は必要なときに必要な分だけ資源を予約することができるが、ユーザ装置では、例えば、ジョブの実行時間を予測できない。時間を実際の実行時間以上に見積もった場合には、時間が余るとそのユーザ装置が予約を開放して初めて、他のユーザ装置が予約できる状態になる。また、時間を実際の実行時間より短く見積もった場合には、現状の技術ではそれまで計算した結果を破棄してしまう可能性がある。
このような課題を解決するためには、ユーザ装置で必要な資源を正確に計算し、ユーザ装置が過不足無く資源を予約できればよいが、ユーザ装置にそのような負担を求めることは望ましいことではない。また、ユーザ装置では、ネットワーク全体の資源を全て把握することは困難であるから、ユーザ装置が正確に予約する資源の計算を行おうとしても計算の基となる資源情報を得ることが困難である。
したがって、ネットワーク側でユーザ装置からの資源予約を管理する機能を有し、効率の良い資源割当てを行うことは有用である。
本発明は、このような背景の下に行われたものであって、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができる資源管理装置および方法を提供することを目的とする。
上述したように、例えば、ジョブの種類を識別したり、ジョブの実行時間を予測することは資源を最大限活用するために有効である。そこで本発明ではジョブの種類を識別して最適な資源の割当てを行うことを特徴とする。これにより、例えば、ジョブを分割して実行できるものと、連続した予約が必要なものとを識別し、分割実行できるものに対しては、細切れに空いている予約タイムスロットに対し予約を入れるなどの処理により資源を有効利用することができるようになる。以下では、ジョブの種類や予測される実行時間や要求される信頼性に応じて資源を割当てる技術について説明する。
また、本発明では、資源管理装置がジョブの種類に対応したサービスクラスを示すジョブデータベースを参照することにより、ユーザ装置はジョブ識別情報を送るだけでジョブのサービスに応じた品質の資源の提供を受けることができる。
すなわち、本発明は、ユーザ装置から送信される資源予約要求を受け取って該当する資源の空きの有無を判定し、空きがある場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置である。
ここで、本発明の特徴とするところは、ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係が記録されたジョブデータベースと、ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを保持する資源情報保持手段と、ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たすネットワーク資源を前記資源情報保持手段に保持されているネットワーク資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる手段とを備えたところにある。
このように、前記ジョブデータベースを参照することより、ユーザに対して最適な品質の資源を提供することができ、ユーザのQoSを満足させることができる。
例えば、前記ネットワーク資源は、ネットワーク上の伝送路または当該伝送路に設定されるパスを含み、前記サービスクラスの情報は、当該パスまたは伝送路の遅延量またはパケット損失許容量の情報を含む。このように、ジョブデータベースに、ネットワーク資源の遅延量またはパケット損失許容量の情報を含むことによってユーザのQoSを満足させることができる。
また、前記ジョブデータベースは、ジョブのプロセスと当該ジョブのプロセス毎の過去の実行時間の履歴との対応関係を保持し、ユーザ装置から資源予約要求を受け取ると前記ジョブデータベースを参照し当該資源予約要求に含まれるジョブの識別情報に基づき当該ジョブとその実行時間の履歴との対応関係を参照し当該ジョブの実行時間を予測してこの予測した実行時間を満たす資源を決定して前記ユーザ装置に割当てる手段を備えることができる。
このように、前記ジョブデータベースを参照することによりジョブの実行にかかる時間を事前に知ることができ、資源の効率化を図ることができる。
また、ユーザ装置に接続されたネットワーク資源のサービスクラスと当該ユーザ装置が実行中または実行予定のジョブのサービスクラスとを比較する手段と、前記比較する手段による比較結果に基づき前記ユーザ装置に接続されたネットワーク資源が当該ユーザ装置が実行中または実行予定のジョブの要求品質を満たせない場合には、当該ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源を探索する手段と、前記探索する手段の探索結果に基づき前記ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源が見つかったときには、前記ユーザ装置と当該コンピュータ資源との接続経路となるネットワーク資源を当該ユーザ装置に割当て、前記実行中または実行予定のジョブを当該コンピュータ資源に移行する手段とを備えることができる。
このように、ユーザ装置に接続されているネットワーク資源では、ユーザ装置のジョブが満足に実行できない場合でも、ユーザ装置のジョブが満足に実行可能なネットワーク資源およびコンピュータ資源を探索し、当該ユーザ装置の代理として当該コンピュータ資源を利用し、ユーザ装置と当該コンピュータ資源との接続経路としてのネットワーク資源を当該ユーザ装置に割当てることによって、ユーザ装置の要求品質を満たす資源を効率良く提供することができる。
また、ユーザ装置から計算結果の情報を収集する計算結果情報収集手段と、前記計算結果情報収集手段により収集された計算結果に基づきジョブの実行結果を判定する手段と、前記判定する手段による判定結果に基づき計算結果に異常を発見した場合には当該計算結果を破棄すると共に再計算を前記ユーザ装置に促す手段と、前記計算結果情報収集手段による計算結果情報収集過程でジョブの実行時間が予約時間を超過した場合には予約時間を延長または再予約を行う手段とを備えることができる。
これにより、無効となる計算結果を速やかに破棄することにより、ジョブ実行の効率化を図ると共に、計算結果の信頼性を向上させることができる。さらに、ジョブの途中で予約時間が終り、ジョブが無効となることを回避できる。
また、ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、要求品質を満たす冗長なネットワーク資源を複数割当てる手段と、ネットワーク資源の障害発生時には障害が発生したネットワーク資源を迂回する他ネットワーク資源に切替える手段とを備えることができる。これにより、ネットワークの信頼性を向上させることができる。
また、ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、冗長なコンピュータ資源を複数割当てる手段と、コンピュータ資源の障害発生時には障害が発生したコンピュータ資源を障害が発生していないコンピュータ資源に切り替える手段とを備えることができる。これにより、コンピュータ資源の信頼性を向上させることができる。
また、本発明を資源管理方法として観点から観ることもできる。すなわち、本発明は、ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザへの割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置が実行する資源管理方法である。
ここで、本発明の特徴とするところは、前記資源管理装置がジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係をジョブデータベースに記録し、ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを資源情報保持手段に保持し、ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たす資源を前記資源情報保持手段に保持されている資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てるところにある。
また、本発明をプログラムとしての観点から観ることもできる。すなわち、本発明は、汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、本発明の資源管理装置の機能に相応する機能を実現させるプログラムである。
本発明のプログラムは記録媒体に記録されることにより、前記汎用の情報処理装置は、この記録媒体を用いて本発明のプログラムをインストールすることができる。あるいは、本発明のプログラムを保持するサーバからネットワークを介して直接前記汎用の情報処理装置に本発明のプログラムをインストールすることもできる。
これにより、汎用の情報処理装置を用いて、本発明の資源管理装置に相応する機能を実現することができる。
なお、本発明のプログラムは、汎用の情報処理装置によって直接実行可能なものだけでなく、ハードディスクなどにインストールすることによって実行可能となるものも含む。また、圧縮されたり、暗号化されたりしたものも含む。
本発明によれば、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができる。
本発明の資源管理装置は、ジョブの実行にかかる時間を予測し、サービスに応じた品質の資源を提供することにより資源を有効活用する技術を提供することができる。以下では、この資源管理装置について詳細に説明する。
(第一の実施形態)
第一の実施形態を図3ないし図5を参照して説明する。図3は第一の実施形態における資源管理装置の機能ブロック図である。図4は第一の実施形態を説明するための資源管理システムの全体構成図である。図5は第一の実施形態を説明するためのシーケンス図である。
本実施形態ではネットワークはMPLS(Multi Protocol Label
Switching)あるいはGMPLS(Generalized MPLS)においてパスの情報を提供する例である。また、資源管理装置2の中に資源を予約するスケジューラ部22の機能を含んだ構成例を示している。しかし、スケジューラ部22は非特許文献1にあるように資源管理装置2の外部にあってもよいので資源管理装置自体の必須要素ではない。
ユーザ装置1は資源管理装置2のスケジューラ部22に対し、ジョブ開始時刻および終了時刻およびジョブの識別情報およびネットワーク帯域を含む資源の予約要求を送る(S10)。予約要求の送信は、ユーザ装置1のユーザが直接ユーザ装置1に指示してもよいし、あるいは、ユーザ装置1がジョブを実行すると自動的に資源管理装置2に必要となる資源を予約するようにしてもよい。
資源管理装置2は、ユーザ装置1から受け取ったジョブ識別情報をジョブデータベース20に送り、要求されたジョブに対する必要なサービスクラスの情報を検索して取得する(S11、S12)。
ジョブサービスクラスの情報は遅延量およびパケット損失許容量の他に、遅延変動量および分散量などにより決められ、例えば、映像配信ではリアルタイム性およびパケット損失も最小であることが要求されるためサービスクラス♯1で予約し、計算処理は、遅延およびパケット損失に対する要求が映像配信より軽いためサービスクラス♯1よりも制限が緩いサービスクラス♯5で予約するなどである。
ジョブサービスクラス情報を取得した資源管理装置2は、前記サービスクラス情報を満たすネットワーク資源を経路データベース24から検索し(S13)、そのネットワーク資源をユーザ装置1に表示する(S14)。ユーザ装置1がそのネットワーク資源を許可すれば(S15)、資源管理装置2は、当該提供を証明するための予約証明書を送信する(S16)。資源管理装置2はサービスクラスを満たすネットワーク資源をネットワーク制御部23からユーザ装置1に提供する(S17)。このようにして、資源管理装置2は、ジョブにあったサービスクラスの資源をユーザ装置1に提供することができる。
図6にジョブデータベース20の一例を示す。ジョブデータベース20はジョブ名とサービスクラス情報(遅延、パケット損失、サービスクラスの識別情報(サービスクラスID))とが対応している。ジョブデータベース20の情報更新にはネットワーク運用者が情報をアップデートしたり、過去に提供したジョブとサービスクラスとの対応表を保存したり、他の資源管理装置のジョブデータベースと通信機能を持ち情報を同期することにより常にジョブデータベース20の内容をアップデートすることができる。
ここではユーザ装置1は直接、資源管理装置2に資源を予約しているが、スケジューラ部22を介してもよい。また、例えば、映像配信と計算とを同時に要求するなど、複数のジョブ識別子を同時に予約することもできる。
図7に経路データベース24の一例を示す。ジョブデータベース20はネットワーク資源であるパスの識別情報(パスID)とパスIDに対応するサービスクラスとパスIDに対応する経路情報とで構成される。
なお、経路データベース24は経路情報はなくても各ノード間のdata linkの品質情報のみを保持しており、予約要求を受けるとそれを基にネットワーク制御部23が経路計算することによって要求を満たした経路を示してもよい。
(第二の実施形態)
第二の実施形態を図8ないし図10を参照して説明する。グリッドコンピューティングシステムは物理計算や金融等様々な用途で使われる可能性があるが、同じ分野でジョブ中に利用されるプログラム中の関数は同じものが多く、関数等のジョブ内容がわかればジョブ実行にかかる計算時間を推測することができる。例えば、金融機関が行っている資産リスク計算ではモンテカルロ法を用いて乱数を用いた計算を何度も行うことで近似解を求めている。
図8に第二の実施形態の資源管理装置2の機能ブロック図を示す。図9に第二の実施形態を説明するためのシーケンス図を示す。図10に第二の実施形態で用いるジョブデータベース20の例を示す。なお、資源管理システムの全体構成は図4と同じである。第二の実施形態で用いるジョブデータベース20は、第一の実施形態で説明したジョブデータベース20が有する情報に加え、図10に示すように、さらに過去に実施したジョブの関数、プロセス、サブルーティン等の履歴とその実行にかかった時間(時間/回数(秒):即ち1回当りの実行時間)との対応表を持っている。図10の例では、さらに繰り返し回数、精度、資源数も併せて記録されている。
資源管理装置2のスケジューラ部22はユーザ装置1から以下に説明する ジョブ内容を含む情報を含む資源の予約要求を受け取る(S21)。すると実行時間計算部25に必要なパラメータを送り、実行時間計算部25を参照することで過去に実施したジョブからジョブ実行時間を予測する(S22、S23、S24)。
資源管理装置2は、ジョブデータベース20から得られたジョブ実行時間とジョブのサービスクラスとを基に条件を満たす資源をスケジューラ部22により検索し(S25)、検索結果(予約可能資源一覧)をユーザ装置1に通知する(S26)。ユーザ装置1がこの資源を承認すれば(S27)、資源がユーザ装置1に提供され、当該提供を証明するための予約証明書が送信される(S28)。
図10にジョブデータベース20の一例を示す。ジョブデータベース20は上のように対応表のみを持っていても、過去の履歴を持っていてもよい。ジョブのプロセスの時間がわかれば右上にあるように計算(T=F(Y)×X)することでジョブ実行時間を予測することができる。ただし、Tはジョブ実行時間、Fはプロセス(ジョブの関数等)の処理に要する時間、Xは繰り返し回数、Yは資源の数である。
このジョブ中に含まれる関数、プロセス、サブルーティンなどを知る方法はユーザが直接入力する方法、資源管理装置2がジョブの中身を読み関数を抜き出す方法がある。これによりジョブ実行にかかる時間を予測することができ、資源の効率化が可能となる。
ユーザ装置1の予約要求には以下のパラメータがある。
1.過去にジョブを実行したことがある場合はいつ実行したか。図10にあるように過去の履歴から実行にかかった時間を参照して計算することができる。
2.ジョブに含まれる関数、プロセス、サブルーティンやその繰り返し数。ジョブ実行時間計算のパラメータとなる。
3.ジョブ実行時間計算の精度。どのくらいの精度でジョブ実行予測時間を計算する必要があるかどうかを確認する。これにより効率よくジョブ実行時間を予測することができる。もちろん精度を高くするためには入力する関数を細かく入力する必要がある。
4.ユーザが希望するジョブ実行時間。資源管理装置2はユーザが希望する時間になるようにプロセス毎にジョブを分割して実行することで、ユーザがジョブを分割して入力する必要がなく、ユーザがプログラムを意識する必要がなくなる。ジョブの分割はジョブデータベースからサブルーティンやプロセスの時間がわかることでジョブを途中終了させることなくジョブを分割することができる。
予約を行う際は、推測時間からその信頼性にもよるが途中で計算が終了することを避けるため推測時間以上に保護時間を取る方法がある。
(第三の実施形態)
大容量な映像配信等の場合には、ユーザ装置1からジョブを実行するとユーザ装置1も映像配信できるだけの十分な資源を持っている必要がある。
図11に第三の実施形態を説明するための図を示す。ユーザ装置1の資源予約要求にジョブの識別情報とジョブの容量と一緒にユーザ装置1の持つネットワーク帯域や品質などのネットワーク資源の情報を入れ資源管理装置2のスケジューラ部22に送る。資源管理装置2はジョブのサービスクラスとユーザ装置1が持つ資源とを比較し、ユーザ装置1の資源の品質が低い場合は、資源管理装置2がユーザ装置1に対し、ジョブデータの移行要求を出す。例えば、図11では、ジョブが10Gbps(太い実線)の帯域が必要なのに対し、ユーザ側のネットワークは1Gbps(細い実線)である。
また、資源管理装置2は、ジョブを移行する空き容量があり、かつジョブのサービスクラスで与えられる十分なネットワークを提供できる資源があるかどうかを問い合わせるメッセージをCRM(クラスタ・リソース・マネージメント)、もしくは各コンピュータ資源に送る。これにより容量が空いていて、かつ十分な品質の資源を提供できるコンピュータ資源を探し出すことができる。
ジョブデータの移行要求を受け取ったユーザ装置1は、ジョブデータを前記空きコンピュータ資源3に移行する。このときはリアルタイムな配信でないため、ネットワーク品質が悪くてもよい。資源管理装置2は、その移行したコンピュータ資源3にサービスクラスを満たすネットワーク資源4を提供することによりユーザ装置1の資源に依存せずに品質の高いサービスが提供可能となる。
また、ユーザ装置1に、このユーザ装置1の代理としてジョブを実行するコンピュータ資源3との接続経路となるネットワーク資源を割当てることにより、ユーザ装置1は、コンピュータ資源3にジョブを移行したり、ジョブの実行状況を監視したり、コンピュータ資源3によって完了したジョブの実行結果を受け取ることができる。このようなジョブの移行や実行状況の監視やジョブの実行結果の受け取りには、サービスクラスの低いネットワーク資源であっても問題はない。
これは映像配信に限らずジョブデータベース20からジョブを実行するための十分な資源を提供できない場合は空き容量を持つコンピュータ資源にジョブを移行し、空き資源とジョブ実行資源とのネットワーク資源を接続することでサービスクラスに応じた資源を提供することができる。
(第四の実施形態)
第四の実施形態を図12および図13を参照して説明する。第四の実施形態ではグリッドコンピューティングで計算を行った場合に、複数の資源で同時にジョブを実行させるため資源管理装置2はそれぞれの資源を管理することが困難なためジョブ実行結果の信頼性を保証することが難しいと考えられる。
また、資源の故障やデータの改竄などにより間違った計算結果がユーザ装置に出力される可能性もある。そこで資源管理装置2にジョブ計算結果監視部26を備えることで、ジョブの計算結果の信頼性を向上させる。
図12に第四の実施形態の資源管理装置2の機能ブロック図を示す。ユーザ装置1がネットワークを予約する際に計算結果の信頼性を確認するための情報を資源管理装置2に送り、資源管理装置2のジョブ計算結果監視部26はその情報を用いてジョブの実行結果を随時確認することによって計算結果の信頼性を上げることができる。
図13に第四の実施形態を説明するためのフローチャートを示す。資源管理装置2のスケジューラ部22は、ユーザ装置1からa〜cの時間帯にジョブの予約要求を受け取る(S30)。資源管理装置2はユーザ装置1に対し、予約証明書を発行する(S31)。
ユーザ装置1は、計算結果の信頼性を向上させるために信頼性向上要求を行い、計算結果を確認するための情報を資源管理装置2に送る(S32)。ジョブは実行時間a〜cになったときに実行され、計算結果は随時ジョブ計算結果監視部26によって確認される(S33、S34、S35)。計算結果が異なった場合は計算結果は破棄され(S36)、再計算が行われる。ジョブの実行が予約時間をオーバーした場合は、スケジューラ部22に予約時間の延長もしくは再予約を行う。
ユーザ装置1が入力するパラメータは、1つ目はジョブ実行結果を確認するための情報である。例えば、計算結果の桁数が4桁以下になることがわかっているならばその情報を入力することで4桁以上になった場合には、結果が出る前に破棄することができる。他にも偶数、奇数、少数などが考えられる。これにより実行結果を常に確認し実行結果の信頼性を向上させることができる。
さらに、計算結果を間違えたコンピュータ資源を資源管理装置2に登録し、統計データを取ることにより、運用者はコンピュータ単体の異常なのか、ネットワークの異常なのか、誰かに改竄されたデータなのか、あるいは、いつの時期に集中しているのかなどを知ることができ、トラブルを未然に防いだり、またはそれをユーザ装置に表示したりすることで、コンピュータ資源の信頼性を判断することができる。
(第五の実施形態)
ジョブ結果の信頼性を向上させる一つの方法として複数資源を冗長して予約することにより信頼性を向上させることができる。この場合は、コンピュータ資源は一つでネットワーク資源を複数提供する方法と、コンピュータ資源もネットワーク資源も複数提供する方法とがある。
1つ目の場合は資源管理装置2がユーザ装置1から資源予約要求時に信頼性向上要求を受け取ると、資源管理装置2はジョブデータベース20を参照しジョブを実行するのに必要なサービスクラスを提供できるネットワーク資源を複数本スケジューラ部22に予約する。
図14に1つ目の信頼性向上方法を説明する図を示す。この際、予約するネットワーク資源(パス)は現用系(太い実線)および予備系(破線)共にサービスクラスを満たす必要がある。例えば、遅延変動が少ないことを要求されるサービスの場合には、資源管理装置2は経路切替時も遅延が変わらないパスを提供する必要がある。
資源管理装置2は複数パスを生成後に遅延差補償手段(図示省略)を備えた、もしくは、遅延差補償装置(図示省略)との通信手段を備えたノード装置6に現用系および予備系の両パスの遅延補償要求を送る。遅延補償要求を受け取ったノード装置6は両パスを終端するノード装置5に対し、両パスから遅延測定用パケットを送り、両パスの遅延差を測定する。両パスの遅延差が異なる場合は遅延差補償手段によって遅延を補償することで同一遅延のパスを提供することができる。1つは現用系パス、他は予備系パスとし、ネットワーク障害発生時は資源管理装置2がネットワーク資源上のノード装置6にパス切替要求を送ることで経路を切替え、ネットワークの信頼性を向上させることができる。
遅延差補償装置は光信号の伝送経路を力学的、または熱学的に変動させ調整する装置でもよいし、VIPA(Virtual Phased Array)のような可変分散装置などを通し分散を与え遅延を制御してもよいし、バッファを用いて遅延を補償してもよいし、タグの遅延制御用フラグからパケットを読み取るときに調整、またはVirtual Concatenationの技術などを用いてもよい。
また、2つ目の場合は、ユーザ装置1から資源予約要求時に信頼性向上要求を受け取ると、資源管理装置2はCRM(クラスタ・リソース・マネージメント)もしくは各クラスタにメッセージを送り他拠点にある複数のコンピュータ資源を予約し、それぞれを繋ぐ複数パスを予約する。
図15に2つ目の信頼性向上方法を説明する図を示す。資源管理装置2はサービス開始後に、コンピュータ資源もしくはCRMのコンピュータ資源の状態を定期的に監視する。信頼性向上手段には2つの方法があり、一つは現用系コンピュータ資源と予備系コンピュータ資源とで同じジョブを実行させる方法と、もう一つは現用系コンピュータ資源がジョブを実行し予備系コンピュータ資源は一定期間毎に現用系コンピュータ資源のバックアップをとる方法である。
コンピュータ資源3−1から一定期間応答が無くなったときに資源管理装置2は障害が発生したと判断し、資源管理装置2が経路切替えを行うノード装置5に対し、コンピュータ資源3−1の切替要求を送ることで現用系のコンピュータ資源3−1から予備系のコンピュータ資源3−2に切り替わる。断が発生する場合には対向コンピュータ資源に対しても経路切替えの通知が必要である。また、資源管理装置2がユーザ装置1にコンピュータ資源切替えを行ったことを通知する。
これによりネットワーク資源の信頼性のみならずコンピュータ資源の信頼性も向上させることができる。
また、ジョブが計算の場合には同じコンピュータ資源に同じジョブを実行させることで資源管理装置2はジョブ実行結果の統計を取り、同じ結果が多い方を信頼性が高い値としてユーザ装置に出力させることもできる。
両方の場合で、資源管理装置2は計算結果を間違えたコンピュータ資源やトラブルが生じたネットワーク資源の情報をユーザ装置1から収集し、それらの資源の運用者にエラーを通知することで早いうちから資源の運用者はコンピュータ資源やネットワーク資源のトラブルを回避することができる。
また、計算結果を間違えたコンピュータ資源を資源管理装置2に登録し、統計データを取ることにより、運用者は、コンピュータ単体の異常なのか、ネットワークのトラブルなのか、いつの時期に集中しているのかを知ることができ、トラブルの原因を解析したり、または、その結果をユーザ装置に表示することで、どの資源の信頼性が高いかを知ることができる。
(第六の実施形態)
第六の実施形態は、汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、第一〜第五の実施形態の資源管理装置2に相応する機能を実現させるプログラムである。
本実施形態のプログラムは記録媒体に記録されることにより、前記汎用の情報処理装置は、この記録媒体を用いて本実施形態のプログラムをインストールすることができる。あるいは、本実施形態のプログラムを保持するサーバからネットワークを介して直接前記汎用の情報処理装置に本実施形態のプログラムをインストールすることもできる。
これにより、汎用の情報処理装置を用いて、本実施形態の資源管理装置2に相応する機能を実現することができる。
なお、本実施形態のプログラムは、汎用の情報処理装置によって直接実行可能なものだけでなく、ハードディスクなどにインストールすることによって実行可能となるものも含む。また、圧縮されたり、暗号化されたりしたものも含む。
本発明によれば、ネットワーク資源やコンピュータ資源の管理機能の高効率化を実現することができるため、ネットワーク管理者およびユーザの双方にとって利便性およびサービス品質の向上を提供することができる。
従来の資源管理システムの全体構成図。 従来の資源管理装置とユーザ装置との間での通信手順を示すシーケンス図。 第一の実施形態における資源管理装置の機能ブロック図。 第一の実施形態を説明するための資源管理システムの全体構成図。 第一の実施形態を説明するためのシーケンス図。 ジョブデータベースの一例を示す図。 経路データベースの一例を示す図。 第二の実施形態の資源管理装置の機能ブロック図。 第二の実施形態を説明するためのシーケンス図。 第二の実施形態で用いるジョブデータベースの例を示す図。 第三の実施形態を説明するための図。 第四の実施形態の資源管理装置の機能ブロック図。 第四の実施形態を説明するためのフローチャート。 1つ目の信頼性向上方法を説明する図。 2つ目の信頼性向上方法を説明する図。
符号の説明
1 ユーザ装置
2 資源管理装置
3、3−1、3−2 コンピュータ資源
4 ネットワーク資源
5、6 ノード装置
20 ジョブデータベース
21 ユーザ装置通信部
22 スケジューラ部
23 ネットワーク制御部
24 経路データベース
25 実行時間計算部
26 ジョブ計算結果監視部

Claims (9)

  1. ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザ装置への割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置において、
    ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係が記録されたジョブデータベースと、
    ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを保持する資源情報保持手段と、
    ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たすネットワーク資源を前記資源情報保持手段に保持されているネットワーク資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる手段と
    を備えたことを特徴とする資源管理装置。
  2. 前記ネットワーク資源は、ネットワーク上の伝送路または当該伝送路に設定されるパスを含み、
    前記サービスクラスの情報は、当該パスまたは伝送路の遅延量またはパケット損失許容量の情報を含む
    請求項1記載の資源管理装置。
  3. 前記ジョブデータベースは、ジョブのプロセスと当該ジョブのプロセス毎の過去の実行時間の履歴との対応関係を保持し、
    ユーザ装置から資源予約要求を受け取ると前記ジョブデータベースを参照し当該資源予約要求に含まれるジョブの識別情報に基づき当該ジョブとその実行時間の履歴との対応関係を参照し当該ジョブの実行時間を予測してこの予測した実行時間を満たす資源を決定して前記ユーザ装置に割当てる手段を備えた
    請求項1記載の資源管理装置。
  4. ユーザ装置に接続されたネットワーク資源のサービスクラスと当該ユーザ装置が実行中または実行予定のジョブのサービスクラスとを比較する手段と、
    前記比較する手段による比較結果に基づき前記ユーザ装置に接続されたネットワーク資源が当該ユーザ装置が実行中または実行予定のジョブの要求品質を満たせない場合には、当該ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源を探索する手段と、
    前記探索する手段の探索結果に基づき前記ユーザ装置の要求品質を満たすネットワーク資源を有するコンピュータ資源が見つかったときには、前記ユーザ装置と当該コンピュータ資源との接続経路となるネットワーク資源を当該ユーザ装置に割当て、前記実行中または実行予定のジョブを当該コンピュータ資源に移行する手段と
    を備えた請求項1記載の資源管理装置。
  5. ユーザ装置から計算結果の情報を収集する計算結果情報収集手段と、
    前記計算結果情報収集手段により収集された計算結果に基づきジョブの実行結果を判定する手段と、
    前記判定する手段による判定結果に基づき計算結果に異常を発見した場合には当該計算結果を破棄すると共に再計算を前記ユーザ装置に促す手段と、
    前記計算結果情報収集手段による計算結果情報収集過程でジョブの実行時間が予約時間を超過した場合には予約時間を延長または再予約を行う手段と
    を備えた請求項1記載の資源管理装置。
  6. ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、要求品質を満たす冗長なネットワーク資源を複数割当てる手段と、
    ネットワーク資源の障害発生時には障害が発生したネットワーク資源を迂回する他ネットワーク資源に切替える手段と
    を備えた請求項1記載の資源管理装置。
  7. ユーザ装置から信頼性向上要求を受け取ると一つのジョブの要求に対し、冗長なコンピュータ資源を複数割当てる手段と、
    コンピュータ資源の障害発生時には障害が発生したコンピュータ資源を障害が発生していないコンピュータ資源に切り替える手段と
    を備えた請求項1記載の資源管理装置。
  8. ユーザ装置から送信される資源予約要求を受け取って該当する資源の当該ユーザ装置への割当可否を判定し、割当可能である場合には、当該資源予約要求を満たす資源を前記ユーザ装置に割当てる資源管理装置が実行する資源管理方法において、
    前記資源管理装置が
    ジョブの種類を示す識別情報とジョブ毎に必要なサービスクラスの情報との対応関係をジョブデータベースに記録し、
    ネットワーク資源とこのネットワーク資源の品質を示すサービスクラス情報とを資源情報保持手段に保持し、
    ユーザ装置からジョブの識別情報を含む資源予約要求を受け取ると前記ジョブデータベースを参照し当該ジョブの識別情報から当該ジョブのサービスクラスの情報を検索し検索したサービスクラスの要求品質を満たす資源を前記資源情報保持手段に保持されている資源の品質を示すサービスクラス情報に基づき決定して前記ユーザ装置に割当てる
    ことを特徴とする資源管理方法。
  9. 汎用の情報処理装置にインストールすることにより、その汎用の情報処理装置に、請求項1ないし7のいずれかに記載の資源管理装置の機能に相応する機能を実現させるプログラム。
JP2006347461A 2006-12-25 2006-12-25 資源管理装置および方法 Pending JP2008158844A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006347461A JP2008158844A (ja) 2006-12-25 2006-12-25 資源管理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006347461A JP2008158844A (ja) 2006-12-25 2006-12-25 資源管理装置および方法

Publications (1)

Publication Number Publication Date
JP2008158844A true JP2008158844A (ja) 2008-07-10

Family

ID=39659674

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006347461A Pending JP2008158844A (ja) 2006-12-25 2006-12-25 資源管理装置および方法

Country Status (1)

Country Link
JP (1) JP2008158844A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010152738A (ja) * 2008-12-25 2010-07-08 Internatl Business Mach Corp <Ibm> リソース管理装置、リソース管理プログラム、およびリソース管理方法
JP2011018198A (ja) * 2009-07-09 2011-01-27 Hitachi Ltd 管理装置及び管理方法
KR101040193B1 (ko) * 2008-10-09 2011-06-09 한국전자통신연구원 편재형 컴퓨팅 환경에서의 서비스 제공방법 및 그 장치
JP2012150567A (ja) * 2011-01-17 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> 資源予約装置及び方法及びプログラム
WO2016088414A1 (ja) * 2014-12-05 2016-06-09 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
KR101745707B1 (ko) * 2015-09-07 2017-06-21 주식회사 케이티 T-sdn 장치 및 t-sdn 장치에서의 자원 충돌 방지 방법
CN112882826A (zh) * 2019-11-30 2021-06-01 华为技术有限公司 一种资源协同调度方法以及装置
JP2024521051A (ja) * 2021-05-14 2024-05-28 エヌイーシー ラボラトリーズ アメリカ インク 5g及びエッジコンピューティングアプリケーションのためのアプリケーション中心のデザイン

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101040193B1 (ko) * 2008-10-09 2011-06-09 한국전자통신연구원 편재형 컴퓨팅 환경에서의 서비스 제공방법 및 그 장치
JP2010152738A (ja) * 2008-12-25 2010-07-08 Internatl Business Mach Corp <Ibm> リソース管理装置、リソース管理プログラム、およびリソース管理方法
US8606919B2 (en) 2008-12-25 2013-12-10 International Business Machines Corporation Resource management tool
JP2011018198A (ja) * 2009-07-09 2011-01-27 Hitachi Ltd 管理装置及び管理方法
JP2012150567A (ja) * 2011-01-17 2012-08-09 Nippon Telegr & Teleph Corp <Ntt> 資源予約装置及び方法及びプログラム
WO2016088414A1 (ja) * 2014-12-05 2016-06-09 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
JP2016110356A (ja) * 2014-12-05 2016-06-20 株式会社ソニー・インタラクティブエンタテインメント 情報処理装置および情報処理方法
KR101745707B1 (ko) * 2015-09-07 2017-06-21 주식회사 케이티 T-sdn 장치 및 t-sdn 장치에서의 자원 충돌 방지 방법
CN112882826A (zh) * 2019-11-30 2021-06-01 华为技术有限公司 一种资源协同调度方法以及装置
JP2024521051A (ja) * 2021-05-14 2024-05-28 エヌイーシー ラボラトリーズ アメリカ インク 5g及びエッジコンピューティングアプリケーションのためのアプリケーション中心のデザイン
JP7686791B2 (ja) 2021-05-14 2025-06-02 エヌイーシー ラボラトリーズ アメリカ インク 5g及びエッジコンピューティングアプリケーションのためのアプリケーション中心のデザイン

Similar Documents

Publication Publication Date Title
US8095935B2 (en) Adapting message delivery assignments with hashing and mapping techniques
US7076540B2 (en) Service assignment apparatus
US7468944B2 (en) Path fault recovery method, switching-back method after recovery from fault, and node using the same
EP2312798B1 (en) Route switching method, server apparatus, boundary node apparatus, route switching system, and route switching program
JP4700738B2 (ja) 通信ノード装置、通信システム、パスリソース割当方法、及びプログラム
WO2005033899A2 (en) Method and apparatus for scheduling resources on a switched underlay network
WO2003003156A2 (en) Distributed information management schemes for dynamic allocation and de-allocation of bandwidth
Chahlaoui et al. A taxonomy of load balancing mechanisms in centralized and distributed SDN architectures
JP5666620B2 (ja) ネットワークシステム、及びそのサービス品質制御方法
JP6982639B2 (ja) マルチエッジクラウドのネットワーク通信制御方法およびエッジコンピューティングシステム
US20060095656A1 (en) System and device for managing storage area network, volume allocation method, and computer software
JP2008158844A (ja) 資源管理装置および方法
CN101981878A (zh) 分布式资源管理系统、分布式资源管理方法、及分布式资源管理程序
US6778504B2 (en) Dynamic soft permanent virtual circuit bulk connection tracing
EP2625610B1 (en) Application allocation in datacenters
US20090180388A1 (en) Dynamic multi-objective grid resources access
CN117667366A (zh) 业务处理方法、装置、电子设备及存储介质
US9450863B2 (en) Route request mediation apparatus, control apparatus, route request mediation method and program
CN108306948B (zh) 调度方法及装置
EP0511925A2 (en) Dynamic backup and recovery of focal points in a computer network
JP2008171325A (ja) 資源管理装置および方法
JP2023170365A (ja) 通信安定化装置、及び通信安定化方法
JP4410082B2 (ja) 通信中継装置、通信中継方法および通信中継プログラム
JP2002007368A (ja) 分散処理システムの業務割当管理サーバ、業務割当管理方式及び業務割当管理方法
EP1538793A2 (en) Tracing active connection modify failures