[go: up one dir, main page]

JP2007164769A - ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラム(ミラーリングされたシステム内の障害の管理) - Google Patents

ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラム(ミラーリングされたシステム内の障害の管理) Download PDF

Info

Publication number
JP2007164769A
JP2007164769A JP2006298894A JP2006298894A JP2007164769A JP 2007164769 A JP2007164769 A JP 2007164769A JP 2006298894 A JP2006298894 A JP 2006298894A JP 2006298894 A JP2006298894 A JP 2006298894A JP 2007164769 A JP2007164769 A JP 2007164769A
Authority
JP
Japan
Prior art keywords
storage location
primary storage
primary
failure
secondary storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006298894A
Other languages
English (en)
Other versions
JP4939174B2 (ja
Inventor
Robert F Kern
ロバート・フレデリック・カーン
Gail A Spear
ゲイル・アンドレア・スピア
David B Petersen
デイヴィッド・ビー・ピーターセン
Gregory E Mcbride
グレゴリー・エドワード・マクブライド
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2007164769A publication Critical patent/JP2007164769A/ja
Application granted granted Critical
Publication of JP4939174B2 publication Critical patent/JP4939174B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2064Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring while ensuring consistency
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/07Responding to the occurrence of a fault, e.g. fault tolerance
    • G06F11/16Error detection or correction of the data by redundancy in hardware
    • G06F11/20Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
    • G06F11/2053Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant
    • G06F11/2056Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements where persistent mass storage functionality or persistent mass storage control functionality is redundant by mirroring
    • G06F11/2082Data synchronisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Debugging And Monitoring (AREA)
  • Hardware Redundancy (AREA)

Abstract

【課題】 ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラムを提供することにある。
【解決手段】 1次記憶位置に対する更新が2次記憶位置にコピーされるという1次記憶位置と2次記憶位置とのコピー関係が維持される。1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害が検出される。障害を検出したことに応答してアプリケーションのためにアプリケーションに提供されない障害メッセージが受信される。1次記憶位置に対する更新の2次記憶位置へのコピーが中断される。コピーを中断したことに応答して障害メッセージがアプリケーションに提供される。
【選択図】 図1

Description

本発明は、ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラムに関する。
災害時回復システムは、典型的には、ある一時点での突然の破局障害、または、ある期間にわたるデータ損失という2つのタイプの障害に対処する。第2のタイプの漸進的な災害では、ボリュームに対する更新が失われる可能性がある。データ更新の回復を支援するために、データのコピーを遠隔地に設ける場合もある。このような二重コピーまたはシャドー・コピーは、典型的には、アプリケーション・システムが新しいデータを1次記憶装置(primary storage device)に書き込むときに作成される。2次サイトにデータのリモート・コピーを維持するために、インターナショナル・ビジネス・マシーンズ社(「IBM」)のExtended Remote Copy(XRC)、Coupled XRC(CXRC)、Global Copy、およびGlobal Mirror Copyなど、種々のコピー技術を使用することができる。これらの種々のコピー技術は、「The IBM TotalStorage DS6000 Series: Copy Services in Open Environments」(IBM文書番号SG24−6783−00、2005年9月発行)および「IBM TotalStorage(IBM Corporationの商標) Enterprise Storage Server(IBM Corporationの商標): Implementing ESS Copy Services with IBM eServer(IBM Corporationの商標) zSeries(IBM Corporationの商標)」(IBM文書番号SG24−5680−04、2004年7月発行)というIBMの資料に記載されている。
データ・ミラーリング・システムでは、データはボリューム対(volume pair)として維持される。1つのボリューム対は、1次記憶装置内のボリュームと、1次ボリューム内に維持されているデータの同一コピーを含む2次記憶装置(secondary storage device)内の対応するボリュームから構成されている。1次および2次記憶装置へのアクセスを制御するために、1次および2次記憶コントローラを使用することができる。特定のバックアップ・システムでは、異なるアプリケーションによって異なる1次記憶装置に書き込まれた更新が一貫性のある時刻(TOD:time-of-day)値をタイム・スタンプとして使用するように、シスプレックス・タイマ(sysplex timer)を使用して複数のシステムの全域で均一の時間を提供する。アプリケーション・システムは、1次記憶装置内のボリュームにこのようなデータ・セットを書き込むときにタイム・スタンプ・データ・セットを使用する。データ更新の保全性は、ボリューム対内の1次ボリュームについて行われたのと同じ順序で2次ボリュームに対して更新が行われることを保証することに関連する。アプリケーション・プログラムによって提供されるタイム・スタンプは、データ更新の論理的順序を決定する。
データベース・システムなどの多くのアプリケーション・プログラムでは、前の書込みが行われていなければ特定の書込みを行うことができず、さもなければ、データ保全性が脅かされるであろう。その保全性が前のデータ書込みの発生に依存するこのようなデータ書込みは、従属書込み(dependent write)として知られている。1次および2次記憶装置内のボリュームは、すべての書込みがその論理順序で転送されたときに、すなわち、それに依存する書込みの前にすべての従属書込みが先に転送されたときに、一貫したものになる。一貫性グループ(consistency group)は、一貫性タイム・スタンプに等しいかまたはそれより前のタイム・スタンプを有する一貫性グループ内のすべてのデータ書込みに関する一貫性時間(consistency time)を有する。一貫性グループは、従属書込みが一貫したやり方で保護されるような1次ボリュームに対する更新の集合である。一貫性時間は、その時間まで2次ボリュームに対する更新が一貫したものになることをシステムが保証する最新時間である。一貫性グループは、複数のボリュームおよび記憶装置の全域でデータ一貫性を維持する。したがって、データが2次ボリュームから回復されると、回復されたデータは一貫したものになる。
一貫性グループは1つのセッション内で形成される。あるセッションに割り当てられたすべてのボリューム対は、その更新が同じ一貫性グループ内に維持されることになる。したがって、1つの一貫性グループ内にまとめてグループ化されるボリュームを決定するために、セッションが使用される。一貫性グループは、1つのジャーナル・デバイスまたはボリューム内で形成される。ジャーナルから一貫性グループを形成するために収集された更新は2次ボリュームに適用される。ジャーナルからの更新が2次ボリュームに適用されている間にシステムの障害が発生した場合、回復操作中に、2次ボリュームへの書込みを完了しなかった更新は、ジャーナルから回復し、2次ボリュームに適用することができる。
データベース・アプリケーションなどの特定のアプリケーションは、あるセッション内に1組の1次ボリューム・セットにユーザ・データを書き込み、他のセッションまたは同じセッション内にもう1組の1次ボリューム・セットに例外情報を書き込むことができる。アプリケーションがユーザ・データを含む1次ボリュームへの書込みを続けることができないような障害が発生した場合、アプリケーションは依然として、例外情報を有する異なる1次ボリュームに障害に関する例外情報を書き込むことができる可能性があり、この障害例外情報は例外情報をミラーリングする2次ボリュームに伝搬される可能性がある。このような場合、2次ボリュームはエラーのないユーザ・データを有するが、2次ボリューム内のユーザ・データに関する例外情報は障害が発生したことを示す。例外情報の2次コピーはミラーリングされたユーザ・データ内に反映されない障害またはエラーを示すので、障害回復操作中に、管理者は、ミラーリングされたコピー内のこのデータ矛盾を修正するために2次サイトで広範な回復操作を実行しなければならない。
「The IBM TotalStorage DS6000 Series: Copy Services in Open Environments」(IBM文書番号SG24−6783−00、2005年9月発行) 「IBM TotalStorage Enterprise Storage Server: Implementing ESS Copy Services with IBM eServer zSeries」(IBM文書番号SG24−5680−04、2004年7月発行)
これらの理由で、当技術分野では、ミラーリングされた環境内の障害を処理するための改良された技法が必要である。
ミラーリングされたシステム内の障害を管理するための方法、システム、およびプログラムが提供される。1次記憶位置に対する更新が2次記憶位置にコピーされるという1次記憶位置と2次記憶位置とのコピー関係が維持される。1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害が検出される。障害を検出したことに応答してアプリケーションのためにアプリケーションに提供されない障害メッセージが受信される。1次記憶位置に対する更新の2次記憶位置へのコピーが中断される。コピーを中断したことに応答して障害メッセージがアプリケーションに提供される。
他の一実施形態では、データ・ムーバ(datamover)は、その関係において1次記憶位置に対する更新を2次記憶位置に非同期式にコピーする。
他の一実施形態では、検出された障害は、1次記憶位置が構成されている記憶装置、記憶装置へのアクセスを可能にする制御ユニット、またはアプリケーションと記憶装置との間の通信を可能にするファブリック内のコンポーネントのうちの少なくとも1つの障害を含む。
他の一実施形態では、障害メッセージは、アプリケーションを含むホスト・オペレーティング・システムまたは1次記憶位置へのアクセスを管理する制御ユニット・オペレーティング・システムによって生成される。
他の一実施形態では、1次記憶位置および2次記憶位置は、第1の1次記憶位置と第1の2次記憶位置とを含む。アプリケーションは、第2の2次記憶位置にコピーされる例外情報を第2の1次記憶位置にさらに書き込む。検出された障害は第1の1次記憶位置のアクセス可能性に関連する障害を含み、更新のコピーを中断することにより、第2の1次記憶位置内の例外情報に書き込まれた検出済みの障害に関する情報が第2の2次記憶位置にコピーされるのを防止する。
他の一実施形態では、1次記憶位置から2次記憶位置にコピーされない更新が中断中にジャーナリングされる。2次記憶位置のデータを1次記憶位置にコピーすることによってデータ回復操作が実行され、2次記憶位置のデータを1次記憶位置にコピーしたことに応答してジャーナリングされた更新が1次記憶位置に適用される。
他の一実施形態では、第1の組の1次記憶位置セットに関して障害が検出される。第1の組の1次記憶位置セットと第2の組の1次記憶位置セットは1つの一貫性グループ内に入っている。更新のコピーの中断は、第1および第2の組の1次記憶位置セットに対する更新を対応する第1および第2の組の2次記憶位置セットにコピーすることに適用される。
他の一実施形態では、コピーの中断は、第3の組の1次記憶位置セットに対する更新を対応する第3の組の2次記憶位置セットにコピーすることに適用されない。第3の組の1次記憶位置セットは第1および第2の組の1次記憶位置セットを含む一貫性グループ内に入っていない。
他の一実施形態では、第1および第2の組の1次記憶位置セットおよび2次記憶位置セットは異なるセッションを含む。第1の組の1次記憶位置セットに対する更新を第1の組の2次記憶位置セットにコピーするために第1のデータ・ムーバが使用され、第2の組の1次記憶位置セットに対する更新を第2の組の2次記憶位置セットにコピーするために第2のデータ・ムーバが使用される。
他の一実施形態では、障害を検出したことに応答して1次記憶位置に対する入出力要求が静止される。更新のコピーを中断したことに応答して1次記憶位置に対する入出力要求の続行が許可される。更新のコピーが中断されている間に入出力要求の続行を許可したことに応答して1次記憶位置に対する更新が示される。
他の一実施形態では、障害メッセージに関連する情報は、中断中に1次記憶位置に書き込まれるが、2次記憶位置にコピーされない。2次記憶位置は、1次記憶位置に書き込まれた障害メッセージに関連する情報を含まない。
図1は、ネットワーク・コンピューティング環境の一実施形態を示している。ネットワーク2は、複数の1次制御ユニット4a・・・4nと、1次記憶装置6a・・・6nと、1次記憶装置6a・・・6nに対する更新を2次制御ユニット10a・・・10nおよび対応する2次記憶装置12a・・・12nにコピーすることを管理するデータ・ムーバ8a・・・8nと、1次記憶装置6a・・・6nに対する更新を書き込むホスト14と、ホスト14に対する1次記憶装置6a・・・6nの可用性の障害をモニターするモニター・システム16と、システム・タイマ18と、マスタ・データ・セット20とを含む。コンポーネント4a・・・4n、6a・・・6n、8a・・・8n、10a・・・10n、12a・・・12n、14、16、18、および20はネットワーク2に接続され、ネットワーク2はこれらのコンポーネント間の通信を可能にする。ネットワーク2は、ネットワーク2の異なるエレメント間に1つまたは複数の通信経路を提供するための1つまたは複数のスイッチを含むことができる。
システム・データ・ムーバ(SDM:systemdata mover)プログラム8a・・・8nは、1次記憶装置6a・・・6nから更新を読み取り、対応する2次記憶装置12a・・・12nに書き込むために1次記憶装置6a・・・6nからの更新の一貫性グループを形成する。1次制御ユニット4a・・・4nでは、キャッシュ内のサイド・ファイル(side file)に更新を書き込むことができる。次に、SDM8a・・・8nによって維持されるジャーナル22a・・・22nに更新を転送することができる。それぞれのジャーナル22a・・・22n内では、一貫性グループ単位に更新が配置される。ジャーナル22a・・・22nは1つまたは複数の一貫性グループを記憶することができる。一貫性グループは、一貫性タイム・スタンプに等しいかまたはそれより前のタイム・スタンプを有する一貫性グループ内のすべてのデータ書込みに関する一貫性時間を有する。一貫性グループは、従属書込みが一貫したやり方で保護されるような1次ボリュームに対する更新の集合である。一貫性時間は、その時間まで2次ボリュームに対する更新が一貫したものになることをシステムが保証する最新時間である。一貫性グループは、複数のボリュームおよび記憶装置の全域でデータ一貫性を維持する。したがって、データが2次ボリュームから回復されると、回復されたデータは一貫したものになる。
一貫性グループは1つのセッション内で形成される。1つのセッションは、1つまたは複数のSDM8a・・・8nによって管理される1次/2次ボリューム対の操作と、ミラー・プログラム4によって管理されるボリューム対の操作とを含むことができる。あるセッションに割り当てられたすべてのボリューム対は、その更新が同じ一貫性グループ内に維持されることになる。したがって、1つの一貫性グループ内にまとめてグループ化されるボリュームを決定するために、セッションが使用される。ジャーナル22a・・・22nからの更新が2次ボリュームに適用されている間にシステムの障害が発生した場合、回復操作中に、2次ボリュームへの書込みを完了しなかった更新は、ジャーナルから回復し、2次ボリュームに適用することができる。
SDM8a・・・8nは、システム内に実現されたプログラムを含むことができる。SDM8a・・・8nは、1次制御ユニット4a・・・4n、2次制御ユニット10a・・・10n、または独立サイトおよびシステムに実現することができる。
マスタ・データ・セット20は、管理されているセッションのリストと、管理された各セッションごとにこのようなセッション内のボリュームに対する最新更新の時間とを含む。マスタ・データ・セット20は、記憶装置6a・・・6n、12a・・・12n内のボリューム上に存在することができる。1次/2次制御対に関するジャーナル・データ・セットは、どの装置上にも存在することができる。図1の各SDM8a・・・8nは、その情報がマスタ・データ・セット20内に示されている1つのセッションの一部である。各セッションには、1つまたは複数のSDM8a・・・8nを割り当てることができる。
システム・タイマ18は、更新が順不同にミラーリングされないことを保証するために、すべてのSDM8a・・・8nの全域で共通時間を使用してボリュームに対する更新を書き込むアプリケーション・プログラムに関する共通時間基準を提供することを保証するために更新に関するタイム・スタンプを提供する。ジャーナル22a・・・22n内の更新が一貫性グループ内で編成されると、一貫性グループ内の更新は2次記憶装置12a・・・12nに適用される。一貫性グループの作成は、どのタイプのデータについても更新順序を保全して、システムがリアルタイムでリモート・サイトにデータをシャドーイングすることを保証する。一貫性グループを使用することは、あるセッション内に2次記憶装置12a・・・12nに適用された更新が、一貫性グループの一貫性時間現在で一貫したものになり、セッション間で一貫したものになることを保証する。更新がジャーナル22a・・・22nから2次記憶装置12a・・・12n内の2次ボリュームに書き込まれる間に障害が発生した場合、回復中に、システム障害中に割り込まれた更新は、ジャーナルから回復し、2次ボリュームに再適用することができる。このようにして、データは、ある時点現在の回復中にセッション内かつセッション全域で一貫していることが保証される。インターナショナル・ビジネス・マシーンズ社(「IBM」)のExtended Remote Copy(XRC)、Coupled XRC(CXRC)、Global Copy、Global Mirror Copy、およびPeer−to−Peer Remote Copy(PPPC)などの同期ミラーリングなどのコピー操作では、複数セッションの全域で一貫性を維持するためにマスタ・データ・セット20を使用する。
ネットワーク2は、ストレージ・エリア・ネットワーク(SAN:Storage Area Network)、ローカル・エリア・ネットワーク(LAN:Local Area Network)、イントラネット、インターネット、広域ネットワーク(WAN:Wide Area Network)、ピアツーピア・ネットワーク、アービトレーテッド・ループ・ネットワークなどを含むことができる。記憶装置6a・・・6n、12a・・・12nは、単純ディスク束(JBOD:Just a Bunch of Disks)、直接アクセス記憶装置(DASD:Direct Access Storage Device)、冗長ディスク・アレイ(RAID:Redundant Array of Independent Disks)というアレイ、仮想化装置、テープ記憶装置、フラッシュ・メモリなどの記憶装置のアレイを含むことができる。
特定の諸実施形態では、ホスト・オペレーティング・システム26および1次制御ユニット・オペレーティング・システム28a・・・28nは、アプリケーション24にエラー通知が送信される前にモニター・システム16に特定の定義済みエラー通知を伝達するためのコードを含む。このようにして、モニター・システム16は、アプリケーション24の前にオペレーティング・システム26および28a・・・28nによって検出された障害に関する情報を処理する。また、2次制御ユニット10a・・・10nもオペレーティング・システム30a・・・30nを含む。
モニター・システム16は、図1に図示されているような制御ユニットの1つの内部にまたは個別のシステム内に実現することができる。
ホスト14は、入出力要求を1次制御ユニット4a・・・4nに伝達する1つまたは複数のアプリケーション24を含む。図2は、ホスト14がデータベース・アプリケーション40を含む、従来技術で知られている一実施形態を示している。データベース・アプリケーションは、データベースのテーブルおよびレコードを記憶するデータベース・テーブルスペース42を更新するために、1次制御ユニット4aを介して1次記憶装置6aにユーザ・データ、すなわち、データベース・レコードを書き込む。ホスト14が1次記憶装置6aへの接続の障害を受信または検出したかあるいは書込みを完了することができず、データベース・アプリケーション40にこのようなエラーを通知した場合、データベース・アプリケーション40は、1次制御ユニット4bを介して1次記憶装置6b内の例外テーブル44にエラーに関する情報を書き込む。
図3は、非同期リモート・コピー技術、たとえば、XRC、CXRCなどを使用して異なるセッションに関するデータをコピーするSDM8a・・・8nによって実行される操作の一実施形態を示している。(ブロック100で)リモート・コピー操作を開始したことに応答して、SDM8a・・・8nは、(ブロック102で)1次記憶位置に対する更新を有する一貫性グループを形成する。前述の通り、SDM8a・・・8nは、1次記憶装置6a・・・6nからの更新を、一貫性グループが形成されるジャーナル22a・・・22nに読み取ることにより、一貫性グループを形成することができる。SDM8a・・・8nは、(ブロック104で)ジャーナル22a・・・22n内の一貫性グループに追加される更新の時間をマスタ・データ・セット20内に示す。SDM8a・・・8nは、(ブロック106で)基準時間(最大限のセッション更新時間のうちの最小値)を決定するために、マスタ・データ・セット20に対し定期的にポーリングすることができる。SDM8a・・・8nは、(ブロック108で)そのタイム・スタンプが決定された基準時間より小さいかまたはそれに等しいそれぞれのジャーナル22a・・・22n内の一貫性グループを、2次記憶装置12a・・・12nにコピーする。代替一実施形態では、データ・ムーバは同期式にデータをコピーすることができる。
図4は、(ブロック120で)モニター・システム16によって最初に処理すべき認識済みトリガ・イベントである障害を検出したことに応答して、ホスト・オペレーティング・システム26によって実行される操作の一実施形態を示している。このような検出に応答して、ホスト・オペレーティング・システム26は、(ブロック122で)モニター・システム16に障害を伝達する。ホスト・オペレーティング・システム26は、ネットワーク2の接続、たとえば、ホスト14と1次制御ユニット4a・・・4nとの間のスイッチ、ケーブルなどの障害を検出することができる。
図5は、(ブロック130で)モニター・システム16によって最初に処理すべき認識済みトリガ・イベントである障害を検出したことに応答して、1次制御ユニット・オペレーティング・システム28a・・・28nによって実行される操作の一実施形態を示している。このような検出に応答して、制御ユニット・オペレーティング・システム28a・・・28nは、(ブロック132で)モニター・システム16に障害を伝達する。1次制御ユニット・オペレーティング・システム28a・・・28nは、ホスト14へのネットワーク2の接続の障害、1次記憶装置6a・・・6nのリソースの障害、たとえば、ディスク、アレイ、またはテープの障害、あるいは1次記憶装置6a・・・6nとそれぞれの1次制御ユニット4a・・・4nとの間の接続の障害を検出することができる。
図4および図5の諸実施形態では、検出された障害がアプリケーション24に通知される前にモニター・システム16が障害メッセージを処理するように、検出された障害はモニター・システム16によって遮断される。たとえば、データベース・アプリケーション40に関しては、障害を遮断し、それをモニター・システム16に経路指定すると、データベース・アプリケーション40が障害に関する情報を例外テーブル44に書き込むのを防止し、それにより、例外テーブル44を有する1次記憶装置4bをミラーリングする2次記憶装置12bにエラー/例外に関する情報が伝搬されるのを防止する。このようにして、モニター・システム16は、ネットワーク2内で生成される多種多様なタイプの障害通知をモニターすることができる。
図6は、ホスト・オペレーティング・システム26または1次制御ユニット・オペレーティング・システム28a・・・28nによって伝達された障害を処理するためにモニター・システム16によって実行される操作の一実施形態を示している。(ブロック150で)ホスト・オペレーティング・システム26または1次制御ユニット・オペレーティング・システム28a・・・28nから1次サイト(たとえば、1次制御ユニットまたは1次記憶装置)の障害の情報を受信すると、モニター・システム16は(ブロック152で)1次記憶装置6a・・・6nのボリュームに対する入出力要求を静止するためのコマンドを発行する。静止するためのこのコマンドは、1次制御ユニット4a・・・4nまたはホスト14あるいはその両方に提供することができる。次にモニター・システム16は、(ブロック154で)すべての1次記憶位置に対する更新を、障害の影響を受ける記憶位置を含む一貫性グループ内の2次記憶位置にコピーすることを中断する。障害が検出された後に行われるすべての更新が2次記憶装置12a・・・12nに伝搬されないように、モニター・システム16は、障害が検出された1次記憶装置6aのボリュームまたはデータ・セットを含む一貫性グループの形成を中断するためのコマンドをSDM8a・・・8nに送信することにより、中断を引き起こすことができる。しかし、ジャーナル22a・・・22n内ですでに形成された一貫性グループは、2次記憶装置12a・・・12nにコピーすることができる。
特定の諸実施形態では、この中断は、障害条件の対象となる1次記憶装置6a・・・6nのボリュームに依存するかまたは障害の対象となる1次記憶装置6a・・・6nのボリュームが依存するすべてのデータに適用することができる。この従属データは、障害条件の対象となる1次ボリュームを含む一貫性グループ内にあるすべてのデータ、すなわち、それ自体に障害が発生しているかまたはホスト14を1次記憶装置6a・・・6nに接続するコンポーネント内の障害のためにアクセスできないすべてのデータを含むことができる。さらに、この従属データは、その一貫性がマスタ・データ・セット20により維持される他のセッション内のボリュームを含むことができる。したがって、その一貫性がマスタ・データ・セット20により障害が発生したボリュームとともに維持されるすべてのセッション内のすべてのボリュームに関して中断を発行することができる。障害条件の対象となるボリュームの一貫性グループに依存しないボリュームに関してまたはそのような一貫性グループ内でミラーリング操作を実行し続けることができ、その他のボリュームは中断の対象となる。
障害条件の対象となるボリュームを含む一貫性グループ内のボリュームに対する入出力を中断した後、モニター・システム16は、(ブロック156で)1次記憶装置6a・・・6nの位置に対する入出力要求の続行を許可するためのコマンドを1次制御ユニット4a・・・4nおよびホスト14に対して発行することができる。この時点で、(ブロック158で)アプリケーション24に障害メッセージを提供することができる。しかし、更新のミラーリングは中断されているので、アプリケーション24が1次記憶装置6a・・・6nに書き込むエラー条件、たとえば、データベース・アプリケーション40が例外テーブル44(図2)に書き込むエラー条件は、いずれも2次記憶装置12a・・・12nに伝搬されない。この時点で、1次制御ユニット4a・・・4nは、中断された1次記憶装置6a・・・6nの位置に対する更新を追跡するために、各ボリュームに関するビットマップを維持する。
図7は、結果的に図5の操作が行われる障害メッセージを引き起こした障害に対処した後で、例外を反映しない2次記憶装置12a・・・12n内のデータを、1次記憶装置6a・・・6nにコピーするための操作を示している。ブロック200で障害の原因が修正され、その修正は、ネットワーク2、ホスト14、1次制御ユニット4a・・・4n、1次記憶装置6a・・・6nなどのコンポーネントを保守することを含む可能性がある。障害に対処した後、モニター・システム16または管理者は、(ブロック202で)中断に関与するすべての2次ボリュームまたはデータ・セットを、対応する1次記憶装置6a・・・6nの位置にコピーするための回復操作を開始することができる。これは、異なる2次記憶装置内にあるか、異なる2次制御ユニットによって管理されるか、または異なるセッション内にあるか、あるいはそれらの組み合わせにある2次ボリュームからのデータをコピーすることを含む可能性がある。データが2次サイトから回復された後、(ブロック204で)中断された1次記憶装置6a・・・6nの位置に対するジャーナリングされた更新が更新済みの1次記憶位置に適用される(すなわち、形成された一貫性グループに更新が含まれない)。これらは、一貫性グループに含まれないジャーナル22a・・・22n内の更新または1次制御ユニット4a・・・4nのサイド・ファイル内に維持される更新を含むことができる。(ブロック206で)中断されたボリュームに関する一貫性グループのミラーリングおよび形成の中断は終了するが、ミラー操作は続行される場合もある。
上述の諸実施形態では、他の1次記憶装置6a内の関連ユーザ・データ、たとえば、ミラーリングされたテーブルスペース42がいかなるエラーも持っていない可能性がある場合、1次記憶装置6b内の例外テーブル44に書き込まれる例外などの障害の表示は2次記憶装置12bに伝搬されない。対応する2次記憶装置12b内でミラーリングされる例外テーブルに例外が伝搬された場合、管理者は、2次記憶装置12aから1次記憶装置6a内のテーブルスペース42(図2)を回復する前にエラーをクリアするために、2次記憶装置12bでエラー回復操作を実行しなければならないであろう。しかし、上述の諸実施形態は例外がミラーリングされた例外テーブル44に伝搬されるのを防止するので、伝搬された例外をクリアするために2次サイトで回復操作を実行する必要はない。このようにして、上述の諸実施形態はダウン時間を削減し、障害回復プロセスを簡略化する。
追加の実施形態の詳細
上述の操作は、ソフトウェア、ファームウェア、ハードウェア、または任意のそれらの組み合わせを生成するために標準のプログラミングまたはエンジニアリングあるいはその両方の技法を使用する方法、装置、またはプログラム(article of manufacture)として実現することができる。プロセッサが「コンピュータ可読媒体(computer readable medium)」からコードを読み取って実行できる場合、上述の操作は、コンピュータ可読媒体内に維持されたコードとして実現することができる。コンピュータ可読媒体は、磁気記憶媒体(たとえば、ハード・ディスク・ドライブ、フレキシブル・ディスク、テープなど)、光学記憶装置(CD−ROM、DVD、光ディスクなど)、揮発性および不揮発性メモリ・デバイス(たとえば、EEPROM、ROM、PROM、RAM、DRAM、SRAM、フラッシュ・メモリ、ファームウェア、プログラマブル・ロジックなど)などの媒体を含むことができる。上述の操作を実現するコードは、ハードウェア・ロジック(たとえば、集積回路チップ、プログラマブル・ゲート・アレイ(PGA:Programmable Gate Array)、特定用途向け集積回路(ASIC:Application Specific Integrated Circuit)など)でさらに実現することができる。さらに、「伝送信号(transmission signal)」が空間を伝搬するかまたは光ファイバ、銅線などの伝送媒体を伝搬できる場合、上述の操作を実現するコードは、伝送信号で実現することができる。コードまたはロジックがコード化される伝送信号は、ワイヤレス信号、衛星伝送、電波、赤外線信号、Bluetoothなどをさらに含むことができる。伝送信号にコード化されるコードまたはロジックを受信局および送信局または受信装置および送信装置でハードウェアまたはコンピュータ可読媒体にデコードし記憶できる場合、コードまたはロジックがコード化される伝送信号は、送信局によって送信し、受信局によって受信することができる。「プログラム(article of manufacture)」は、コードを実現できるコンピュータ可読媒体、ハードウェア・ロジック、または伝送信号、あるいはこれらの組み合わせを含む。上述の操作の諸実施形態を実現するコードがコード化される装置は、コンピュータ可読媒体またはハードウェア・ロジックを含むことができる。当然のことながら、当業者であれば、本発明の範囲を逸脱せずにこの構成に対して多くの変更を行うことができ、プログラムが当技術分野で知られている適切な情報伝送媒体を含むことができることを認識するであろう。
「一実施形態(an embodiment)」、「実施形態(embodiment)」、「諸実施形態(embodiments)」、「この実施形態(the embodiment)」、「これらの実施形態(the embodiments)」、「1つまたは複数の実施形態(one or more embodiments)」、「いくつかの実施形態(some embodiments)」、および「ある実施形態(one embodiment)」という用語は、特に明記されていない限り、「本発明(複数も可)の1つまたは複数(だがすべてではない)実施形態」を意味する。
「含む(including)」、「含む(comprising)」、「有する(having)」という用語ならびにその変形は、特に明記されていない限り、「含むがそれに限定されない」ことを意味する。
列挙された項目のリストは、特に明記されていない限り、それらの項目の一部または全部が互いに排他的であることを示すわけではない。
「1つの(a)」、「ある(an)」、および「その(the)」という用語は、特に明記されていない限り、「1つまたは複数」を意味する。
互いに連絡している装置は、特に明記されていない限り、互いに連続的に連絡している必要はない。加えて、互いに連絡している装置は、直接的に、あるいは1つまたは複数の仲介を介して間接的に、通信することができる。
互いに連絡しているいくつかのコンポーネントを含む一実施形態の記述は、このようなコンポーネントがすべて必要であることを示しているわけではない。これに反して、本発明について考えられる多様な実施形態を例示するために、様々な任意選択のコンポーネントが記載されている。
さらに、プロセス・ステップ、方法ステップ、アルゴリズムなどは、ある順序で記述することができるが、このようなプロセス、方法、およびアルゴリズムは、代替順序で機能するように構成することもできる。換言すれば、記述可能な任意の順番または順序のステップは必ずしも、それらのステップがその順序で実行されるという要件を示すわけではない。本明細書に記載されているプロセスのステップは、実用的な任意の順序で実行することができる。さらに、いくつかのステップは同時に実行することができる。
単一の装置またはプログラム(article)が本明細書に記載されている場合、単一の装置/プログラムの代わりに2つ以上の装置/プログラム(それらが協働するかどうかは問わない)を使用できることは容易に明らかになるであろう。同様に、2つ以上の装置またはプログラム(それらが協働するかどうかは問わない)が本明細書に記載されている場合、2つ以上の装置またはプログラムの代わりに単一の装置/プログラムを使用できるか、あるいは示されている数の装置またはプログラムの代わりに異なる数の装置/プログラムを使用できることは容易に明らかになるであろう。ある装置の機能または特徴あるいはその両方は、その代わりに、このような機能/特徴を有するものとして明示的に記載されていない1つまたは複数の他の装置によって具体化することができる。したがって、本発明のその他の諸実施形態はその装置そのものを含む必要はない。
図3、図4、図5、図6、および図7に例示されている操作は、特定の順序で発生する特定のイベントを示している。代替諸実施形態では、特定の操作を異なる順序で実行するか、変更するか、または除去することもできる。その上、上述のロジックにステップを追加することができ、そのステップが依然として上述の諸実施形態に適合することができる。さらに、本明細書に記載されている操作は順次実行できるかまたは特定の複数の操作を並行して処理することができる。さらに、操作は単一の処理装置によって実行するかまたは複数の分散処理装置によって実行することができる。
本発明の様々な諸実施形態に関する上記の記述は、例示および説明のために提示されたものである。網羅することまたは開示された正確な形式に本発明を限定することは意図されていない。上記の教示を考慮すると、多くの変更および変形が可能である。本発明の範囲は、この詳細な説明ではなく、むしろ特許請求の範囲によって制限されることが意図されている。上記の仕様、例、およびデータは、本発明の構成の製造および使用に関する完全な説明を提供するものである。本発明の精神および範囲を逸脱せずに本発明の多くの実施形態を作成できるので、本発明は特許請求の範囲に存在するものである。
ネットワーク・コンピューティング環境の一実施形態を示す図である。 当技術分野で知られているやり方でデータベース・アプリケーションがユーザ・データおよび例外情報を2つの異なる1次記憶装置に書き込む方法の一例を示す図である。 1次記憶装置を2次記憶装置にミラーリングするための操作の一実施形態を示す図である。 検出された障害をモニター・システムに伝達するための操作の一実施形態を示す図である。 検出された障害をモニター・システムに伝達するための操作の一実施形態を示す図である。 検出された障害を処理するための操作の一実施形態を示す図である。 ミラーリングされた2次記憶装置からのデータ回復を実行するための操作の一実施形態を示す図である。
符号の説明
2:ネットワーク
4a・・・4n:1次制御ユニット
6a・・・6n:1次記憶装置
8a・・・8n:データ・ムーバ(SDM)
10a・・・10n:2次制御ユニット
12a・・・12n:2次記憶装置
14:ホスト
16:モニター・システム
18:システム・タイマ
20:マスタ・データ・セット
22a・・・22n:ジャーナル
24:アプリケーション
26:オペレーティング・システム
28a・・・28n:オペレーティング・システム
30a・・・30n:オペレーティング・システム

Claims (20)

  1. 1次記憶位置に対する更新が2次記憶位置にコピーされるという前記1次記憶位置と前記2次記憶位置とのコピー関係を維持するステップと、
    前記1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害を検出するステップと、
    前記障害を検出したことに応答して前記アプリケーションのために前記アプリケーションに提供されない障害メッセージを受信するステップと、
    前記1次記憶位置に対する更新の前記2次記憶位置へのコピーを中断するステップと、
    前記コピーを中断したことに応答して前記障害メッセージを前記アプリケーションに提供するステップと、
    を含む方法。
  2. データ・ムーバが、前記関係において前記1次記憶位置に対する更新を前記2次記憶位置に非同期式にコピーする、請求項1に記載の方法。
  3. 検出された前記障害が、前記1次記憶位置が構成されている記憶装置、前記記憶装置へのアクセスを可能にする制御ユニット、または前記アプリケーションと前記記憶装置との間の通信を可能にするファブリック内のコンポーネントのうちの少なくとも1つの障害を含む、請求項1に記載の方法。
  4. 前記障害メッセージが、前記アプリケーションを含むホスト・オペレーティング・システムまたは前記1次記憶位置へのアクセスを管理する制御ユニット・オペレーティング・システムによって生成される、請求項1に記載の方法。
  5. 前記1次記憶位置および前記2次記憶位置が第1の1次記憶位置と第1の2次記憶位置とを含み、前記アプリケーションが、第2の2次記憶位置にコピーされる例外情報を第2の1次記憶位置にさらに書き込み、検出された前記障害が前記第1の1次記憶位置のアクセス可能性に関連する障害を含み、更新の前記コピーを中断することにより、前記第2の1次記憶位置内の前記例外情報に書き込まれた検出済みの前記障害に関する情報が前記第2の2次記憶位置にコピーされるのを防止する、請求項1に記載の方法。
  6. 前記1次記憶位置から前記2次記憶位置にコピーされない更新が前記中断中にジャーナリングされ、
    前記2次記憶位置のデータを1次記憶位置にコピーすることによってデータ回復操作を実行するステップと、
    前記2次記憶位置のデータを前記1次記憶位置にコピーしたことに応答してジャーナリングされた前記更新を前記1次記憶位置に適用するステップと、
    をさらに含む、請求項1に記載の方法。
  7. 第1の組の1次記憶位置セットに関して前記障害が検出され、前記第1の組の1次記憶位置セットと第2の組の1次記憶位置セットが1つの一貫性グループ内に入っており、更新のコピーの前記中断が、前記第1および第2の組の1次記憶位置セットに対する更新を対応する第1および第2の組の2次記憶位置セットにコピーすることに適用される、請求項1に記載の方法。
  8. コピーの前記中断が、第3の組の1次記憶位置セットに対する更新を対応する第3の組の2次記憶位置セットにコピーすることに適用されず、前記第3の組の1次記憶位置セットが前記第1および第2の組の1次記憶位置セットを含む前記一貫性グループ内に入っていない、請求項7に記載の方法。
  9. 前記第1および第2の組の1次記憶位置セットおよび2次記憶位置セットが異なるセッションを含み、前記第1の組の1次記憶位置セットに対する更新を前記第1の組の2次記憶位置セットにコピーするために第1のデータ・ムーバが使用され、前記第2の組の1次記憶位置セットに対する更新を前記第2の組の2次記憶位置セットにコピーするために第2のデータ・ムーバが使用される、請求項7に記載の方法。
  10. 前記障害を検出したことに応答して前記1次記憶位置に対する入出力要求を静止するステップと、
    前記更新の前記コピーを中断したことに応答して前記1次記憶位置に対する入出力要求の続行を許可するステップと、
    前記更新の前記コピーが中断されている間に前記入出力要求の続行を許可したことに応答して前記1次記憶位置に対する更新を示すステップと、
    をさらに含む、請求項1に記載の方法。
  11. 前記障害メッセージに関連する情報が、前記中断中に前記1次記憶位置に書き込まれるが、前記2次記憶位置にコピーされず、前記2次記憶位置が、前記1次記憶位置に書き込まれた前記障害メッセージに関連する前記情報を含まない、請求項1に記載の方法。
  12. 1次および2次記憶位置と連絡しているシステムであって、コピー関係により、前記2次記憶位置にコピーされる前記1次記憶位置に対する更新が示され、
    プロセッサと、
    操作を実行するために前記プロセッサによって実行されるコードを含むコンピュータ可読媒体とを含み、前記操作が、
    前記1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害に関連し、前記アプリケーションに提供されない障害メッセージを受信するステップと、
    前記1次記憶位置に対する更新の前記2次記憶位置へのコピーを中断するステップと、
    前記コピーを中断したことに応答して前記障害メッセージを前記アプリケーションに提供するステップと、
    を含む、システム。
  13. 受信された前記障害メッセージが、前記1次記憶位置が構成されている記憶装置、前記記憶装置へのアクセスを可能にする制御ユニット、または前記アプリケーションと前記記憶装置との間の通信を可能にするファブリック内のコンポーネントのうちの少なくとも1つの障害に帰因する、請求項12に記載のシステム。
  14. 前記障害メッセージが、前記アプリケーションを含むホスト・オペレーティング・システムまたは前記1次記憶位置へのアクセスを管理する制御ユニット・オペレーティング・システムによって生成される、請求項12に記載のシステム。
  15. 前記1次記憶位置および前記2次記憶位置が第1の1次記憶位置と第1の2次記憶位置とを含み、前記アプリケーションが、第2の2次記憶位置にコピーされる例外情報を第2の1次記憶位置にさらに書き込み、検出された前記障害が前記第1の1次記憶位置のアクセス可能性に関連する障害を含み、更新の前記コピーを中断することにより、前記第2の1次記憶位置内の前記例外情報に書き込まれた検出済みの前記障害に関する情報が前記第2の2次記憶位置にコピーされるのを防止する、請求項12に記載のシステム。
  16. 前記障害が第1の組の1次記憶位置セットに関連し、前記第1の組の1次記憶位置セットと第2の組の1次記憶位置セットが1つの一貫性グループ内に入っており、更新のコピーの前記中断が、前記第1および第2の組の1次記憶位置セットに対する更新を対応する第1および第2の組の2次記憶位置セットにコピーすることに適用される、請求項12に記載のシステム。
  17. コピーの前記中断が、第3の組の1次記憶位置セットに対する更新を対応する第3の組の2次記憶位置セットにコピーすることに適用されず、前記第3の組の1次記憶位置セットが前記第1および第2の組の1次記憶位置セットを含む前記一貫性グループ内に入っていない、請求項16に記載のシステム。
  18. 前記操作が、
    前記障害メッセージを受信したことに応答して前記1次記憶位置に対する入出力要求を静止するステップと、
    前記更新の前記コピーを中断したことに応答して前記1次記憶位置に対する入出力要求の続行を許可するステップと、
    前記更新の前記コピーが中断されている間に前記入出力要求の続行を許可したことに応答して前記1次記憶位置に対する更新を示すステップと、
    をさらに含む、請求項12に記載のシステム。
  19. 前記障害メッセージに関連する情報が、前記中断中に前記1次記憶位置に書き込まれるが、前記2次記憶位置にコピーされず、前記2次記憶位置が、前記1次記憶位置に書き込まれた前記障害メッセージに関連する前記情報を含まない、請求項12に記載のシステム。
  20. 1次および2次記憶位置と通信可能なコードを含むプログラムであって、コピー関係により、前記2次記憶位置にコピーされる前記1次記憶位置に対する更新が示され、前記コードにより操作を実行させることができ、前記操作が、
    前記1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害を検出するステップと、
    前記1次記憶位置に対する更新をアプリケーションが書き込むのを妨げる障害に関連し、前記アプリケーションに提供されない障害メッセージを受信するステップと、
    前記1次記憶位置に対する更新の前記2次記憶位置へのコピーを中断するステップと、
    前記コピーを中断したことに応答して前記障害メッセージを前記アプリケーションに提供するステップと、
    を含む、プログラム。
JP2006298894A 2005-12-13 2006-11-02 ミラーリングされたシステム内の障害を管理するための方法 Expired - Fee Related JP4939174B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/302348 2005-12-13
US11/302,348 US7627775B2 (en) 2005-12-13 2005-12-13 Managing failures in mirrored systems

Publications (2)

Publication Number Publication Date
JP2007164769A true JP2007164769A (ja) 2007-06-28
JP4939174B2 JP4939174B2 (ja) 2012-05-23

Family

ID=38165755

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006298894A Expired - Fee Related JP4939174B2 (ja) 2005-12-13 2006-11-02 ミラーリングされたシステム内の障害を管理するための方法

Country Status (4)

Country Link
US (1) US7627775B2 (ja)
JP (1) JP4939174B2 (ja)
CN (1) CN100543690C (ja)
TW (1) TWI416318B (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010533911A (ja) * 2007-07-19 2010-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 異なるネットワークを介した1次ストレージから2次ストレージへの書き込みコピーを管理するための方法、システム、およびコンピュータ・プログラム
JP2018181038A (ja) * 2017-04-17 2018-11-15 富士通株式会社 管理プログラム、管理装置および管理方法
JP2023128349A (ja) * 2022-03-03 2023-09-14 Necプラットフォームズ株式会社 ストレージシステム、サーバ、パス切替方法、およびプログラム

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7788231B2 (en) * 2006-04-18 2010-08-31 International Business Machines Corporation Using a heartbeat signal to maintain data consistency for writes to source storage copied to target storage
JP4818843B2 (ja) * 2006-07-31 2011-11-16 株式会社日立製作所 リモートコピーを行うストレージシステム
US7793148B2 (en) * 2007-01-12 2010-09-07 International Business Machines Corporation Using virtual copies in a failover and failback environment
US7904682B2 (en) * 2007-07-19 2011-03-08 International Business Machines Corporation Copying writes from primary storages to secondary storages across different networks
US20090150721A1 (en) * 2007-12-10 2009-06-11 International Business Machines Corporation Utilizing A Potentially Unreliable Memory Module For Memory Mirroring In A Computing System
US8069345B2 (en) * 2008-10-29 2011-11-29 Netapp, Inc. Methods and systems for recovering a computer system using boot volume data from a storage area network
US8583887B1 (en) 2008-10-31 2013-11-12 Netapp, Inc. Non-disruptive restoration of a storage volume
US20120254124A1 (en) * 2011-03-30 2012-10-04 International Business Machines Corporation System, method, and computer program product for disaster recovery using asynchronous mirroring
US9116634B2 (en) 2011-06-10 2015-08-25 International Business Machines Corporation Configure storage class memory command
US9058275B2 (en) * 2011-06-10 2015-06-16 International Business Machines Corporation Data returned responsive to executing a start subchannel instruction
US9021180B2 (en) 2011-06-10 2015-04-28 International Business Machines Corporation Clearing blocks of storage class memory
US9116788B2 (en) 2011-06-10 2015-08-25 International Business Machines Corporation Using extended asynchronous data mover indirect data address words
US9058243B2 (en) 2011-06-10 2015-06-16 International Business Machines Corporation Releasing blocks of storage class memory
US9116789B2 (en) 2011-06-10 2015-08-25 International Business Machines Corporation Chaining move specification blocks
US9323668B2 (en) 2011-06-10 2016-04-26 International Business Machines Corporation Deconfigure storage class memory command
US9021226B2 (en) 2011-06-10 2015-04-28 International Business Machines Corporation Moving blocks of data between main memory and storage class memory
US9021179B2 (en) 2011-06-10 2015-04-28 International Business Machines Corporation Store storage class memory information command
US8898515B1 (en) * 2012-06-28 2014-11-25 Emc International Company Synchronous replication using multiple data protection appliances across multiple storage arrays
US8909985B2 (en) 2012-07-12 2014-12-09 International Business Machines Corporation Multiple hyperswap replication sessions
US9251018B2 (en) * 2012-12-19 2016-02-02 International Business Machines Corporation Enhanced recovery of highly available computing systems
US9497266B2 (en) 2013-02-22 2016-11-15 International Business Machines Corporation Disk mirroring for personal storage
US9235485B2 (en) * 2013-07-22 2016-01-12 International Business Machines Corporation Moving objects in a primary computer based on memory errors in a secondary computer
CN108228481B (zh) * 2016-12-21 2026-01-16 伊姆西Ip控股有限责任公司 用于保证数据一致性的方法和设备
US10133510B2 (en) 2017-01-19 2018-11-20 International Business Machines Corporation Apparatus, method, and program product for data integrity during asynchronous remote copy
US10572357B2 (en) * 2017-03-29 2020-02-25 International Business Machines Corporation Switching over from using a first primary storage to using a second primary storage when the first primary storage is in a mirror relationship
CN107272669B (zh) * 2017-08-14 2019-07-05 中国航空无线电电子研究所 一种机载故障管理系统
US10642701B2 (en) * 2018-09-07 2020-05-05 International Business Machines Corporation Releasing space on secondary storage device for resynchronization
US11023609B2 (en) 2018-11-26 2021-06-01 International Business Machines Corporation Fault prevention shell for preventing system disruption

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276306A (ja) * 1999-03-24 2000-10-06 Hitachi Ltd ネットワーク接続ディスク装置
JP2003296205A (ja) * 2002-04-04 2003-10-17 Hitachi Ltd ネットワーク構成機器特定方法及びその実施システム並びにその処理プログラム
JP2004227445A (ja) * 2003-01-27 2004-08-12 Hitachi Ltd 記憶装置サブシステムにおけるコピー方法および記憶装置サブシステム
JP2005055945A (ja) * 2003-08-04 2005-03-03 Hitachi Ltd 仮想テープライブラリ装置
US20050102582A1 (en) * 2003-11-11 2005-05-12 International Business Machines Corporation Method and apparatus for controlling data storage within a data storage system
JP2005222110A (ja) * 2004-02-03 2005-08-18 Hitachi Ltd ストレージサブシステム

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5544347A (en) 1990-09-24 1996-08-06 Emc Corporation Data storage system controlled remote data mirroring with respectively maintained data indices
GB9317436D0 (en) 1993-08-03 1993-10-06 Plessey Telecomm Telecommunications system
US5764903A (en) 1994-09-26 1998-06-09 Acer America Corporation High availability network disk mirroring system
US6871271B2 (en) * 2000-12-21 2005-03-22 Emc Corporation Incrementally restoring a mass storage device to a prior state
US6820098B1 (en) 2002-03-15 2004-11-16 Hewlett-Packard Development Company, L.P. System and method for efficient and trackable asynchronous file replication
US7225204B2 (en) 2002-03-19 2007-05-29 Network Appliance, Inc. System and method for asynchronous mirroring of snapshots at a destination using a purgatory directory and inode mapping
US7024586B2 (en) * 2002-06-24 2006-04-04 Network Appliance, Inc. Using file system information in raid data reconstruction and migration
US7069465B2 (en) * 2002-07-26 2006-06-27 International Business Machines Corporation Method and apparatus for reliable failover involving incomplete raid disk writes in a clustering system
US20050050286A1 (en) 2003-08-28 2005-03-03 International Busines Machines Corporation Apparatus and method for asynchronous logical mirroring
US7278049B2 (en) 2003-09-29 2007-10-02 International Business Machines Corporation Method, system, and program for recovery from a failure in an asynchronous data copying system
US7188272B2 (en) 2003-09-29 2007-03-06 International Business Machines Corporation Method, system and article of manufacture for recovery from a failure in a cascading PPRC system
US7085902B2 (en) 2003-09-29 2006-08-01 International Business Machines Corporation Storage system with symmetrical mirroring
JP4728031B2 (ja) * 2005-04-15 2011-07-20 株式会社日立製作所 リモートコピーペアの移行を行うシステム
JP2006309506A (ja) * 2005-04-28 2006-11-09 Fujitsu Ltd リモートコピー処理方法、プログラム及び装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000276306A (ja) * 1999-03-24 2000-10-06 Hitachi Ltd ネットワーク接続ディスク装置
JP2003296205A (ja) * 2002-04-04 2003-10-17 Hitachi Ltd ネットワーク構成機器特定方法及びその実施システム並びにその処理プログラム
JP2004227445A (ja) * 2003-01-27 2004-08-12 Hitachi Ltd 記憶装置サブシステムにおけるコピー方法および記憶装置サブシステム
JP2005055945A (ja) * 2003-08-04 2005-03-03 Hitachi Ltd 仮想テープライブラリ装置
US20050102582A1 (en) * 2003-11-11 2005-05-12 International Business Machines Corporation Method and apparatus for controlling data storage within a data storage system
JP2005222110A (ja) * 2004-02-03 2005-08-18 Hitachi Ltd ストレージサブシステム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010533911A (ja) * 2007-07-19 2010-10-28 インターナショナル・ビジネス・マシーンズ・コーポレーション 異なるネットワークを介した1次ストレージから2次ストレージへの書き込みコピーを管理するための方法、システム、およびコンピュータ・プログラム
JP2018181038A (ja) * 2017-04-17 2018-11-15 富士通株式会社 管理プログラム、管理装置および管理方法
JP2023128349A (ja) * 2022-03-03 2023-09-14 Necプラットフォームズ株式会社 ストレージシステム、サーバ、パス切替方法、およびプログラム
JP7409700B2 (ja) 2022-03-03 2024-01-09 Necプラットフォームズ株式会社 ストレージシステム、サーバ、パス切替方法、およびプログラム

Also Published As

Publication number Publication date
CN1983202A (zh) 2007-06-20
CN100543690C (zh) 2009-09-23
US20070168713A1 (en) 2007-07-19
TWI416318B (zh) 2013-11-21
US7627775B2 (en) 2009-12-01
TW200801928A (en) 2008-01-01
JP4939174B2 (ja) 2012-05-23

Similar Documents

Publication Publication Date Title
JP4939174B2 (ja) ミラーリングされたシステム内の障害を管理するための方法
US7603581B2 (en) Remote copying of updates to primary and secondary storage locations subject to a copy relationship
CN100403272C (zh) 用于处理到远程存储位置的故障恢复的方法、系统
JP5182824B2 (ja) 1次サイトと2次サイトとの間でデータを同期化するための方法、システム、及びコンピュータ・プログラム
US9483366B2 (en) Bitmap selection for remote copying of updates
US7552295B2 (en) Maintaining consistency when mirroring data using different copy technologies
US8055865B2 (en) Managing write requests to data sets in a primary volume subject to being copied to a secondary volume
JP4988370B2 (ja) 結合セッション環境におけるセッションのクラスタのためのセッション情報の統合方法、システム、およびプログラム
JP5147941B2 (ja) 異なるネットワークを介した1次ストレージから2次ストレージへの書き込みコピーを管理するための方法、システム、およびコンピュータ・プログラム
JP2004343776A (ja) カスケード式再同期を利用する障害回復システム
US7904682B2 (en) Copying writes from primary storages to secondary storages across different networks
US8903766B2 (en) Data mirroring using a virtual connection
JP2012230489A (ja) ディスクアレイ装置、同期方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111018

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120116

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120207

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150302

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4939174

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees