[go: up one dir, main page]

JP2008033921A - 加速ストライピングによる分散記憶システム - Google Patents

加速ストライピングによる分散記憶システム Download PDF

Info

Publication number
JP2008033921A
JP2008033921A JP2007172961A JP2007172961A JP2008033921A JP 2008033921 A JP2008033921 A JP 2008033921A JP 2007172961 A JP2007172961 A JP 2007172961A JP 2007172961 A JP2007172961 A JP 2007172961A JP 2008033921 A JP2008033921 A JP 2008033921A
Authority
JP
Japan
Prior art keywords
data
logical
storage
software system
multiplexing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007172961A
Other languages
English (en)
Other versions
JP2008033921A5 (ja
Inventor
Stephen J Sicola
ジェイ.シコラ スティーブン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seagate Technology LLC
Original Assignee
Seagate Technology LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/477,967 external-priority patent/US7913038B2/en
Application filed by Seagate Technology LLC filed Critical Seagate Technology LLC
Publication of JP2008033921A publication Critical patent/JP2008033921A/ja
Publication of JP2008033921A5 publication Critical patent/JP2008033921A5/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】各々のデータ記憶容量を自己決定的に割当て、管理し、保護し、全体記憶要求を収容するため網へ仮想記憶空間としてその容量を提供するインテリジェントなデータ記憶サブシステムを提供する。
【解決手段】データを第2数の論理装置に記憶するために第1数の論理装置から読み出したデータを単一のチャネルにコード化するよう構成されるメモリ空間に常駐するソフトウェア・システムがデータ記憶装置に提供される。
【選択図】図6

Description

(関連出願)
本出願は2005年6月3日提出の、本願の譲渡人に譲渡された米国特許出願番号第11/145、403号の一部継続出願である。
本発明は分散データ記憶システムの分野に一般的に関係し、特に、これには制限されないが、メモリに記憶したデータを再ストライプする方法と装置に関係する。
業界標準アーキテクチャのデータ転送速度がインテル社により製造された80386プロセッサのアクセス速度に合わせられなくなった時、コンピュータ網は増殖し始めた。ローカルエリア網(LAN)は網にデータ記憶能力を集約することによりストレージエリア網(SAN)へ進化した。直接接続の記憶装置では不可能なオーダー以上のより大きな記憶を処理する能力のような、SANの機器により処理される関連データと機器の集約により、ユーザーは顕著な利点を実現し、かつこれを管理可能なコストで実行できた。
最近、データ記憶サブシステムを制御する網中心方式に動向が向いてきている。すなわち、記憶部を集約したのと同様に、記憶部の機能を制御するシステムもサーバーと網自体から切り離される。例えば、ホストベースのソフトウェアは保守及び管理タスクをインテリジェント・スイッチまたは特殊な網記憶サービス・プラットフォームに委託可能である。アプライアンスベースのソリューションはホストで実行するソフトウェアを不要とし、企業のノードとして配置されたコンピュータ内で動作する。いずれにせよ、インテリジェントな網ソリューションは、記憶割当てルーチン、バックアップ・ルーチン、及びフォールトトレラント方式のようなものをホストとは独立に集中化可能である。
ホストから網へのインテリジェンスの移行はこのようないくつかの問題を解決したが、ホストへの仮想記憶の表現を変更する柔軟性は一般的に欠如しているので本質的な困難を解決できない。例えば、記憶したデータは信頼性の問題から移動する必要がある、または成長する網を収容するためより多くの記憶容量を追加する必要がある。これらの場合、ホストまたは網のどちらかを変更して新たなまたは変更した記憶空間の存在を知らせなければならない。必要なものは、その各々のデータ記憶容量を自己決定的に割当て、管理し、保護し、全体記憶要求を収容するため網へ仮想記憶空間としてその容量を提供するインテリジェントなデータ記憶サブシステムである。分散計算環境はこれらのインテリジェントな記憶装置を全体プロビジョニングと共に記憶データの全体ストライピングと再ストライピングに使用する。本発明の実施例が指向するのはこのソリューションである。
本発明の実施例は、元々記憶されたデータのバックアップに付随する集中的なオーバーヘッドを避けて、これを再ストライプ構成に復元する再ストライピング能力を有する分散記憶システムを一般的に指向する。
ある実施例では、データを第2数の論理装置に記憶するために第1数の論理装置から読み出したデータを単一のチャネルにコード化するよう構成されるメモリ空間に常駐するソフトウェア・システムがデータ記憶装置に提供される。
ある実施例では、第1数の論理装置上にストライプされたデータを単一のチャネルにコード化し、コード化データを第2数の論理装置にデコードする方法が提供される。
ある実施例では、メモリ空間を有し、データをメモリ空間の論理装置に再ストライプする装置を有するインテリジェント記憶要素がデータ記憶システムに提供される。
本請求の発明を特徴付けるこれらの及び各種その他の機能と利点は以下の詳細な説明を読み、関連する図面を参照することにより明らかとなる。
図1は本発明の実施例が有用である例示のコンピュータシステム100である。1つ以上のホスト102がローカルエリア網(LAN)及び/または広域網(WAN)106を介して1つ以上の網接続サーバー104にネットワークされる。LAN/WAN106はワールドワイドウェブを通して通信するインターネット・プロトコル(IP)網インフラストラクチャを使用することが望ましい。ホスト102は、多数のインテリジェント記憶要素(「ISE」)108の1つ以上に記憶されたデータを日常的に必要とするサーバー104中に常駐するアプリケーションをアクセスする。従って、SAN110はサーバー104をISE108に接続して記憶データをアクセスする。ISE108は、企業またはデスクトップ・クラスの記憶媒体を中に有する、シリアルATA及びファイバチャネルのような各種の選択通信プロトコルを通してデータを記憶するデータ記憶容量109のブロックを提供する。
図2は図1のコンピュータシステムの簡略化線図である。ホスト102は網またはファブリック(fabric)110を介して互いにかつISE108の対(各々AとBと記載)と相互作用する。各ISE108は独立ドライブの冗長アレイ(RAID)として特徴付けられるデータ記憶装置の組としてデータ記憶容量109上で動作することが望ましい二重冗長制御器112(A1、A2とB1、B2と記載)を含む。制御器112とデータ記憶容量109は、各種の制御器112が並列の冗長リンクを利用し、システム100により記憶されたユーザー・データの少なくともあるものがデータ記憶容量109の少なくとも1つの組に記憶されるようフォールトトレラント配置を利用することが望ましい。
Aホスト・コンピュータ102とA ISE108は第1サイトに物理的に位置し、Bホスト・コンピュータ102とB ISE108は第2サイトに物理的に位置し、Cホスト・コンピュータ107はさらに第3サイトにいることも可能であるとさらに考えられるが、このようなことは単なる例示であり、制限ではない。分散コンピュータシステム上の全てのエンティティは何らかの型式のコンピュータ網を通して接続される。
図3は本発明の実施例に従って構成されたISE108を図示する。棚114はミッドプレーン116と電気的接続する制御器112と受容的に係合する空洞部を設ける。棚114はまた、キャビネット(図示せず)内に支持される。複数ディスク組立体(MDA)118の対がミッドプレーン116の同じ側で棚114と受容的に係合される。ミッドプレーン116の反対側には、緊急電源を与える二重電池122、二重交流電源124、二重インターフェース・モジュール126が接続される。二重部品はMDAのどちらかまたは同時に両方で動作するよう構成され、部品故障の場合のバックアップ保護を提供することが望ましい。
図4は本発明のある実施例に従って構成されたMDA118の拡大部分展開等角投影図である。MDA118は上部区画130と下部区画132を有し、各々が5台のデータ記憶装置128を支持する。区画130、132は、ミッドプレーン116(図3)と動作的に係合するコネクタ136を有する共通回路板134と接続するデータ記憶装置128と整合する。ラッパー138は電磁干渉シールドを提供する。MDA118のこの例示実施例は、本発明の譲渡人に譲渡され、引用により本明細書に包含される複数ディスクアレイのキャリア装置と方法という名称の特願第10/884、605号の主題事項である。MDAのその他の例示実施例は、本発明の譲渡人に譲渡され、引用により本明細書に包含される同一タイトルの特願第10/817、378号の主題事項である。別の等価な実施例では、MDA118は以下で説明するように密封筐体内で提供可能である。
図5は本発明の実施例の使用に適する例示のデータ記憶装置128の等角投影図で、回転媒体ディスクドライブの形式である。移動データ記憶媒体を有する回転スピンドルを以下の説明に使用するが、別の等価な実施例では、固体メモリ素子のような非回転媒体装置を使用する。データ記憶ディスク140はモーター142により回転されてディスク140のデータ記憶位置を読取/書込ヘッド(「ヘッド」)143へ与える。ヘッド143は、ヘッド143をディスク140の内部及び外部トラック間で放射方向に移動可能な回転アクチュエータ144の遠心端で支持される。ヘッド143はフレックス回路146を介して回路板145へ電気的に接続される。回路板145はデータ記憶装置128の機能を制御する制御信号を送受信するようにされる。コネクタ148が回路板145に電気的に接続されて、データ記憶装置128をMDA118の回路板134(図4)と接続するようにする。
図6は本発明の実施例により構成されたISE108の線図である。制御器112はインテリジェント記憶プロセッサ(ISP)150と関連して動作して、データ一体性の管理された信頼性を提供する。ISP150は制御器112、MDA118、またはISE108内のどこかに常駐可能である。
制御器112は各々、通信ポート155、157を介したデータパック151、153への遠隔アクセス指令に応答する。説明の都合上、図6の制御器112は、全てが記憶容量のホスト指令に応答する、データパック151から論理装置(「LUN」)1とLUN2を作成する。また、本説明の都合上、データパック151、153はデータ記憶用の八台のデータ記憶装置128と二台の予備データ記憶装置128を含むものと仮定する。
管理信頼性の特徴は、RAID戦略のような信頼可能なデータ記憶形式を起動することを含む。例えば、複数個の異なるRAID形式の内の選択されたものを選択的に使用するシステムを提供することにより、相対的により堅牢なデータ記憶用のシステムが生成され、MDA118を管理するために使用するソフトウェアの複雑性を減少するファームウェア・アルゴリズムの最適化を可能とすると共に、記憶障害状態からの相対的に迅速な復帰を可能とする。この複数RAID形式システムのこれらの及びその他の特徴は本譲渡人に譲渡され、引用により本明細書に包含される記憶媒体データ構造とその方法という名称の特願第10/817、264号に記載されている。
管理信頼性はまたシステムの監視使用を基にした診断及び訂正ルーチンのスケジューリングを含む。データ復元操作はデータのコピーと再構成に実行される。ISP150は、データ損失なしに全体データ記憶容量の「自己修復(self−healing)」を容易にするようにMDA118に統合される。本明細書で考慮する管理信頼性機能のこれらの及びその他の特徴は、本譲渡人に譲渡され、引用により本明細書に包含される管理信頼性記憶システムとその方法という名称の特願第10/817、617号に記載されている。管理信頼性のその他の特徴は、例えば本譲渡人に譲渡され、引用により本明細書に包含される分散記憶システムの予測故障からの決定的予防回復という名称の特願第11/040、410号に開示されているような、所定の規則と関連する予防故障指示への応答を含む。
図7は冗長ISP150の対が常駐するISP回路板152の線図である。ISP150はデータ記憶容量109をSANファブリック110にインターフェースする。各ISP150はルーティング、ボリューム管理、及びデータ移行と複製のような各種の記憶サービスを管理可能である。ISP150はバス158により結合された2つのISPサブシステム154、156に板152を分割する。ISPサブシステム154は、各々リンク160、162によりファブリック110と記憶容量109に結合された「B」と記載されたISP150を含む。ISP154はまた実時間オペレーティングシステムを実行するポリシー・プロセッサ164も含む。ISP150とポリシー・プロセッサ164はバス166を介して通信し、かつ両者はメモリ168と通信する。
図8は本発明の実施例に従って構成された例示のISPサブシステム154の線図である。ISP150は、交差点スイッチ(CSP)186メッセージ・クロスバーを介してリスト・マネージャ182、184と通信する多数の機能制御器(170−180)を含む。従って、制御器(170−180)はメモリ・モジュールにアクセスするため及び/またはISP動作を起動するため、各々特定の条件に応答してCSPメッセージを発生し、このメッセージをCPS186を通してリスト・マネージャ182、184に送信可能である。同様に、リスト・マネージャ182、184からの応答はCPS186を介して制御器(170−180)の任意のものと通信可能である。図8の配置と関連する説明は例示のものであり、本発明の考えられる実施例を限定するものではない。
ポリシー・プロセッサ164はISP150を介して所要の動作を実行するようプログラム可能である。例えば、ポリシー・プロセッサ164は、CPS186を介してメッセージを送受信するリスト・マネージャ182、184と通信可能である。ポリシー・プロセッサ164への応答はメモリ168レジスタを読み出す信号への割り込みとしての役割を果たすことが可能である。
図9は、FC、iSCSI、またはSASのような、予め選択された複数個の通信プロトコルの内のいくつかでホスト102と通信するための、インテリジェント制御器112による、ISE108の柔軟性の利点を示す線図である。ISE109はホスト指令の抽象レベルを確定し、これにより指令と関係する物理記憶109に仮想記憶ボリュームをマップするようプログラム可能である。
現在の目的には、用語「仮想記憶ボリューム」とは物理記憶の論理抽象化に一般的に対応する論理エンティティを意味する。「仮想記憶ボリューム」は、例えば、カウント・キー・データ・アーキテクチャで固定ブロックアーキテクチャまたはレコードで連続的にアドレスされるブロックであるかのように(論理的に)処理されるエンティティを含むことが可能である。仮想記憶ボリュームは1つ以上の記憶要素上に物理的に配置可能である。
図10は任意のホスト102と独立のISE108により実行可能なデータ管理サービスの型式の線図である。例えば、RAID管理は、所要数のデータ記憶装置128、128、128、…128内で実行されるデータのストライピングにより、フォールトトレラントなデータ一体性のために局所的に制御可能である。仮想化サービスを局所的に制御して論理エンティティにメモリ容量を割り当て及び/または逆割り当てすることが可能である。上述した管理信頼性方式や同一ISE108内の論理ボリューム間のデータ移行のようなアプリケーション・ルーチンは、同様に局所的に制御可能である。
図11で、ISE108はさらなる記憶容量のホスト指令に応答して他のLUN3を生成した。本実施例は、LUN1とLUN2に既に存在するデータを全3台のLUN上に再ストライプする加速の方法を考える。有利なことに、本実施例の加速再ストライピングは、既存のデータをバックアップし、ついでこれを新たに構成した記憶空間に復元する関連技術のソリューションでの比較的時間のかかる処理を必要としない。すなわち、本ソリューションでは、ISE108は、本明細書で記述した処理に従って、再ストライプ過程を開始した時と再ストライピングの速度のみを基にしてシステム100に利用可能である。開始した時間とデータを転送する速度は、システム100性能への再ストライピング過程の悪い影響を最小とするため、他のシステム100リソース要求の関係に関連して、変更可能である。また、再ストライピング・アプリケーションへの入力を簡略化し、遠隔ホスト102からアプリケーションをオフロードすることにより、本実施例は全体として分散システム100への少ないオーバーヘッドの支出で過程を加速する。
図12は説明の都合上、LUN1とLUN2が共に記憶データにより容量を充填されていることを示す。列A−Hはデータパック151内のデータ記憶装置128(または「ドメイン」)の各々を表す。「A1」と名付けられたような、各列と行の交差点は、ドメインの各々に割り当てた記憶容量の塊を表す。各行の複数個の塊が全てのドメイン上での記憶容量のストライプを形成する。従って、LUN1の第1ストライプは塊A1−H1から構成され、LUN2の第1ストライプは塊A5−H5から構成される。LUN1の終わりからLUN2の始まりとの間の空間は単に説明用のものである。これらのまたはその他の連続するLUNの間の記憶空間には事実何らの間隙もないものと想定される。
図13は、メモリに常駐し経路200を介して選択した複数個のLUNからデータを読み取り、経路202を介して単一チャネルに当該データをコード化するよう構成されたソフトウェア(またはファームウェア)システム199を実行するISP150を図式的に図示する。次いで、ソフトウェア・システム199は経路204を介して第2の複数個の論理装置にデータを再ストライプするためにコード化データをデコードする。
ソフトウェア・システム199は多重化操作(「マルチプレックス」)206を実行してデータをコード化し、逆多重化操作(「デマルチプレックス」)208を実行してコード化データをデコードすることが望ましい。現在の説明の都合上、元々LUN1とLUN2(図12)に記憶されたデータは本発明の実施例に従ってLUN1−3上に再ストライプされる。言い換えると、現在記憶されたデータは二台のLUNから三台のLUNに再ストライプされる。従って、図13ではn=2とm=3である。
図14は、LUN1(キャッシュ168から)からデータ・ストライプA1−H1を読み取り、これをLUN1に記憶することにより開始する多重化−逆多重化ソフトウェア制御回路を図示する。図15は多重化−逆多重化回路がいかに入力ソースと出力到達先上を同期的に連続して、次にデータ・ストライプA5−H5をキャッシュ168から読み取ってこれをLUN2に記憶するかを図示する。図16は多重化−逆多重化回路が入力ソースと出力到達先をシリアルにループする方法を十分図示している。すなわち、全ての入力ソースを順番に回った後、たとえ逆多重化操作が全ての出力到達先をまだ回っていなくとも、多重化操作はLUN1に復帰する。
図17で、データ・ストライプA6−H6がキャッシュ168から読み取られてLUN1に記憶される。図18で、多重化―逆多重化回路はキャッシュ168からのデータ・ストライプA3−H3を次に読み取ってこれをLUN2に記憶するよう回る。図19で、データ・ストライプA7−H7はLUN3に記憶される。図20で、データ・ストライプA4−H4はLUN1に記憶される。最後に、図21で、データ・ストライプA8−H8がLUN2に記憶される。
図14−21に図示した再ストライピング・ユーティリティは基本的には同じ処理であるが、n=3とm=2である処理を実行することにより逆転可能である。図21に示すような状態にあるものとして元々記憶されたデータを考えると、図22はLUN1にデータ・ストライプA1−H1を記憶することにより復元過程を開始する。図23で、多重化−逆多重化回路はLUN2にデータ・ストライプA5−H5を記憶するために連続的に巡回する。図24はLUN1にデータ・ストライプA2−H2を次に記憶する回路を図示し、図25でデータ・ストライプA6−H6はLUN2に記憶され、図26でデータ・ストライプA3−H3はLUN1に記憶され、図27でデータ・ストライプA7−H7はLUN2に記憶され、図28でデータ・ストライプA4−H4がLUN1に記憶される。最後に、図29でデータ・ストライプA8−H8はLUN2に記憶される。
図30は本発明の実施例に従って再ストライピングする方法250の流れ図である。方法250は、多重化−逆多重化操作用に入力ノードの数nと出力ノードの数mを選択することによりブロック252で開始する。例えば、図14−21の2つのLUNから3つのLUNへのデータのストライプに対しては、n=2とm=3である。ブロック254で、データは入力ノードから同期的にコード化され、出力ノードへデコードされる。ブロック256で、最後のデータ・ストライプを新たに構成した論理ボリュームに再ストライプしたかどうかを決定する。ブロック256の決定が「YES」の場合、方法250は終了し、そうでない場合、制御はブロック258に渡る。ブロック258で、多重化操作と逆多重化操作が次の各ノードに連続的にループされ、次のノードでデータがコード化されデコードされるブロック254へ制御が復帰する。
最後に、図31は図4と同様であるが、基部190とこれに密封して取り付けたカバー192から作成された密封筐体内に含まれる複数個のデータ記憶装置128と回路板134を有する。MDA118Aを形成するデータ記憶装置128を密封して係合することは、データ記憶装置128の配置が所定の最適配置から変更されないことを保証することを含む多数の利点をユーザーに与える。このような配置は、MDA118A製造業者がシステムを最適性能に調整することも可能とし、データ記憶装置128の数、サイズおよび型式を与えることが、明確に定義可能である。
密封MDA118Aはまた、製造業者が中の記憶媒体の群の信頼性とフォールトトレランスを最大することが可能である。これは、複数スピンドル配置のドライブを最適化することにより実行される。設計最適化は、コストを減少し、性能を増強し、信頼性を高め、一般的にMDA118A内のデータの寿命を延長する。さらに、MDA118Aの設計自体が殆どゼロの回転振動と高冷却効率環境を提供し、これは本願の譲渡人に譲渡された強化RVIの記憶アレイという名称の共願の米国特願第11/145、404号の主題事項である。これは、MDA118の信頼性、性能、または容量を妥協することなく内部の記憶媒体をよりコスト的な基準で製造可能とする。密封MDA118Aは従って、単一障害点ではなく、殆ど完全な回転振動の回避と冷却効率を提供する。これは、MDA118Aの設計を最適ディスク媒体特性とし、同時に信頼性と性能を増強しつつコストを削減することを可能とする。
要約すると、記憶媒体に対してデータ記憶と読出し関係にある各独立に動作可能なアクチュエータに隣接する記憶媒体を各々支持する複数個の回転可能なスピンドルを含む、分散記憶システムの内蔵型ISEが提供される。ISEはさらに、分散記憶システムの遠隔装置により使用される複数個の媒体に仮想記憶ボリュームをマップするようにされているISPを含む。
ある実施例では、ISEは複数個のスピンドルと共通密封ハウジング内に収めた媒体を有する。ISPは、RAID方法論のような、フォールトトレラント式にデータを記憶する仮想記憶ボリュームにメモリを割り当てることが望ましい。さらにISPは、観測した予測記憶故障に応答して原位置での決定的予防復元段階を開始するような、データ記憶過程の管理信頼性方法論を実行可能である。ISEは、2つ以上のディスクのデータ記憶媒体から構成されたディスク・スタックを各々が有する複数個のデータ記憶装置から構成されることが望ましい。
他の実施例では、ISEは、内臓型の複数個の離散データ記憶装置と、データ記憶装置と通信して遠隔装置から受信した指令を抽象化するようにし、これにより関連メモリを関係付けるISPとを含む分散記憶システムと考えられる。ISPは、分散記憶システムの1つ以上の遠隔装置により使用される複数個のデータ記憶装置に仮想記憶ボリュームをマップするようにされていることが望ましい。以前と同様に、複数個のデータ記憶装置と媒体は共通の密封ハウジング内に収めることも可能である。ISPは、RAID方法論のようにフォールトトレラント的にデータを記憶する仮想記憶ボリュームにメモリを割り当てることが望ましい。ISPはさらに観測された予測記憶故障に応答してデータ記憶装置での原位置の決定的予防復元段階を開始可能である。
別の実施例では、ホストと、網を通してホストと通信するバックエンド記憶サブシステムとを含み、ホストとは独立に内蔵記憶容量を仮想化する装置を含む、分散記憶システムが提供される。
仮想化の装置は、複数個の離散的な個別にアクセス可能なデータ記憶装置を特徴とすることが可能である。仮想化の装置は複数個のデータ記憶装置と関係する記憶容量の仮想ブロックをマップすることを特徴とすることが可能である。仮想化の装置は複数個のデータ記憶装置と関連制御部を密封的にコンテナ化することを特徴とすることが可能である。仮想化の装置はRAID方法論への制限なしのような、フォールトトレラント的にデータを記憶することを特徴とすることが可能である。仮想化の装置は観測された予測記憶故障に応答して原位置での決定的予防復元段階を開始することを特徴とすることが可能である。仮想化の装置は複数個のスピンドル・データ記憶アレイを特徴とすることが可能である。
本明細書の都合上、用語「仮想化の装置」は、各データ記憶サブシステム内以外のデータ記憶空間にマップするシステム・インテリジェンスに含まれる以前に試行したソリューションを明示的に考えていない。例えば、「仮想化の装置」はデータ記憶サブシステムの機能を制御する記憶マネージャの使用を考えておらず、またSANファブリック内またはホスト内のマネージャまたはスイッチの配置も考えていない。
本実施例は、メモリ空間に常駐して、第2数の論理装置にデータを記憶するために第1数の論理装置から読み出したデータを単一チャネルにコード化するよう構成されたソフトウェア・システムを有するデータ記憶装置をさらに考える。ソフトウェア・システムは、第2数の論理装置にデータを記憶する前にコード化データをデコードするよう構成されることが望ましい。
例えば、ソフトウェア・システムはデータをコード化するために第1数の論理装置上に元々ストライプされたデータを多重化するよう構成可能である。この場合、ソフトウェア・システムは第2数の論理装置上にデータを再ストライプするためにコード化データを逆多重化するよう構成可能である。ソフトウェア・システムは1つ以上の入力ソースと1つ以上の出力到達先上で各々データ多重化とデータ逆多重化を同期的にループすることが望ましい。
第1数の論理装置と第2数の論理装置は異なることも可能であり、すなわち、ある場合には第2数は第1数より大きく、他の場合には第1数は第2数より大きい。
ソフトウェア・システムは、第2数の論理装置から再ストライプしたデータを多重化することにより第1数の論理装置上にデータの元のストライピングも復元可能である。
ある実施例では、ソフトウェア・システムは分散記憶システムのインテリジェントな記憶要素に常駐可能である。
他の実施例では、第1数の論理装置上のデータをコード化し、コード化データを第2数の論理装置上にデコードする方法が提供される。コード化段階は第1数の論理装置に元々ストライプされたデータを多重化することを特徴とし、デコード段階は第2数の論理装置上にデータを再ストライプするためにコード化データを逆多重化することを特徴とする。コード化段階とデコード段階は、1つ以上の入力ソースと1つ以上の出力の各々にデータ多重化とデータ逆多重化を同期的にループすることを特徴とする。本方法はまた、第2数の論理装置から再ストライプしたデータを多重化することにより第1数の論理装置上にデータの元のストライピングを復元することを考えることも可能である。
他の実施例では、メモリ空間を有するインテリジェントな記憶要素と、メモリ空間の論理装置にデータを再ストライピングする装置とを有するデータ記憶システムが提供される。本説明と添付の請求の範囲の意味の都合上、「再ストライピングの装置」という句の意味は、これには限定されないが上述した多重化と逆多重化操作のような、上述したようなコード化/デコード操作を明白に必要とする。「再ストライピングの装置」の意味は、元の記憶されたデータをバックアップし、次いでこれを新たなストライプ配列に復元することを含む以前に試行されたソリューションを明らかに含まない。
本発明の各種の実施例の多数の特徴と利点を、本発明の各種の実施例の構造と機能の詳細と共に以上の説明に記載してきたが、この詳細な説明は単なる例示であり、特に添付の請求の範囲に表示される用語の広範囲な一般的意味により指示される最大の範囲で本発明の原理内で構造及び部品の配置に関して、変更を詳細部に加えてもよいことを理解すべきである。例えば、本発明の範囲と要旨から逸脱することなく特定の処理環境に応じて特定の要素を変更してもよい。
さらに、本明細書で記載した実施例はデータ記憶アレイに向けられているが、請求項の主題事項はこれには限定されず、請求の発明の範囲と要旨から逸脱することなく各種のその他の処理システムを利用可能であることが当業者には認められる。
本発明の実施例が有用なコンピュータ・システムの図式表現。 図1のコンピュータ・システムの簡単化した図式表現。 本発明の実施例に従って構成したインテリジェント記憶要素の展開した等角投影図。 図3のインテリジェント記憶要素の複数ディスクアレイの部分展開等角投影図。 図4の複数ディスクアレイに使用した例示のデータ記憶装置。 図3のインテリジェント記憶要素の機能ブロック線図。 図3のインテリジェント記憶要素のインテリジェント記憶プロセッサ回路板の機能ブロック線図。 図3のインテリジェント記憶要素のインテリジェント記憶プロセッサの機能ブロック線図。 図3のインテリジェント記憶要素により実行される指令抽象化および関連メモリ・マッピング・サービスの機能ブロック線図表現。 図3のインテリジェント記憶要素により実行されるその他の例示のデータサービスの機能ブロック線図。 図6と同様の図であるが、新たな記憶空間の割当て用のホスト指令に続くものである。 図6でLUN1とLUN2に記憶されるデータのマトリクス表現。 本発明の実施例に従って動作するよう構成されたソフトウェア・システムの線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUN上に2つのLUNに元々記憶されたデータの再ストライピングに関連する連続的同期多重化と逆多重化の連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 3つのLUNから2つのLUNへデータを復元する連続線図表現。 本発明の実施例に従って再ストライプする方法の段階を示す流れ図。 図4と同様の展開等角投影図であるが、密封された筐体内に収容されたデータ記憶装置と回路板を有する。
符号の説明
108 ISE
109 データ記憶
112 制御装置
118 MDA
128 データ記憶装置
150 ISP
154、156 ISPサブシステム
164 ポリシー・プロセッサ
170−180 機能制御器
182、184 リスト・マネージャ
186 CSP
199 ソフトウェア・システム
206 多重化操作
208 逆多重化操作

Claims (20)

  1. データ記憶装置において、第1数の論理装置から検索したデータを単一チャネルにコード化して第2数の論理装置にデータを記憶するよう構成されたメモリ空間に常駐するソフトウェア・システムを含むことを特徴とするデータ記憶装置。
  2. 請求項1に記載の装置において、前記ソフトウェア・システムは前記第2数の論理装置に前記データを記憶する前に前記コード化データをデコードするよう構成されたことを特徴とする装置。
  3. 請求項2に記載の装置において、前記ソフトウェア・システムは前記第1数の論理装置上で元々ストライプされたデータを多重化してデータをコード化するよう構成されたことを特徴とする装置。
  4. 請求項3に記載の装置において、ソフトウェア・システムは前記第2数の論理装置上にデータを再ストライプするためにコード化データを逆多重化するよう構成されたことを特徴とする装置。
  5. 請求項1に記載の装置において、第1数と第2数が異なることを特徴とする装置。
  6. 請求項5に記載の装置において、第2数が第1数より大きいことを特徴とする装置。
  7. 請求項5に記載の装置において、第1数が第2数より大きいことを特徴とする装置。
  8. 請求項4に記載の装置において、前記ソフトウェア・システムは前記第2数の論理装置からの再ストライプ・データを多重化することにより前記第1数の論理装置上にデータの元のストライピングを復元するよう構成されたことを特徴とする装置。
  9. 請求項4に記載の装置において、ソフトウェア・システムは1つ以上の入力ソースと1つ以上の出力到達先の各々の上でデータ多重化と逆多重化を同期的に連続するよう構成されたことを特徴とする装置。
  10. 請求項9に記載の装置において、前記ソフトウェア・システムは各々データ多重化とデータ逆多重化時に入力ソースと出力到達先をシリアル的にループするよう構成されたことを特徴とする装置。
  11. 請求項10に記載の装置において、ソフトウェア・システムは分散記憶システムのインテリジェントな記憶要素に常駐していることを特徴とする装置。
  12. 第1数の論理装置上にストライプされたデータを単一チャネルにコード化するステップと、
    コード化データを第2数の論理装置上にデコードするステップと、
    を含む方法。
  13. 請求項12に記載の方法において、前記コード化ステップは第1数の論理装置に元々ストライプされたデータを多重化することを特徴とする方法。
  14. 請求項13に記載の方法において、前記デコードステップは第2数の論理装置上にデータを再ストライプするためにコード化データを逆多重化することを特徴とする方法。
  15. 請求項12に記載の方法において、前記第1数は前記第2数と異なることを特徴とする方法。
  16. 請求項15に記載の方法において、前記第1数は前記第2数より大きいことを特徴とする方法。
  17. 請求項15に記載の方法において、前記第1数は前記第2数より小さいことを特徴とする方法。
  18. 請求項14に記載の方法において、前記第2数の論理装置から再ストライプ・データを多重化することにより前記第1数の論理装置上にデータの元のストライピングを復元するステップをさらに含む方法。
  19. 請求項14に記載の方法において、前記コード化ステップと前記デコードステップは、各々1つ以上の入力ソースと1つ以上の出力到達先へのデータ多重化とデータ逆多重化を同期的にループすることを特徴とする方法。
  20. データ記憶装置において、
    メモリ空間を有するインテリジェント記憶要素と、
    メモリ空間の論理装置にデータを再ストライプする装置と、
    を含むデータことを特徴とする記憶装置。
JP2007172961A 2006-06-29 2007-06-29 加速ストライピングによる分散記憶システム Pending JP2008033921A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
US11/477,967 US7913038B2 (en) 2005-06-03 2006-06-29 Distributed storage system with accelerated striping

Publications (2)

Publication Number Publication Date
JP2008033921A true JP2008033921A (ja) 2008-02-14
JP2008033921A5 JP2008033921A5 (ja) 2010-08-05

Family

ID=39123212

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007172961A Pending JP2008033921A (ja) 2006-06-29 2007-06-29 加速ストライピングによる分散記憶システム

Country Status (1)

Country Link
JP (1) JP2008033921A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205630A (ja) * 2008-02-29 2009-09-10 Nec Corp フォールトトレラントサーバ、フルバックアップ方法、およびフルバックアッププログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003223284A (ja) * 2002-01-31 2003-08-08 Toshiba Corp ディスクアレイ装置及び同装置における動的記憶容量拡張方法
US20030192005A1 (en) * 2002-04-05 2003-10-09 Seagate Technology Llc Method and apparatus for error detection
US20040133743A1 (en) * 2002-12-26 2004-07-08 Fujitsu Limited RAID apparatus and logical device expansion method thereof
US20060047908A1 (en) * 2004-09-01 2006-03-02 Hitachi, Ltd. Disk array apparatus
US20060268444A1 (en) * 2005-05-31 2006-11-30 Seagate Technology Llc High speed and high capacity data storage array

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003223284A (ja) * 2002-01-31 2003-08-08 Toshiba Corp ディスクアレイ装置及び同装置における動的記憶容量拡張方法
US20030192005A1 (en) * 2002-04-05 2003-10-09 Seagate Technology Llc Method and apparatus for error detection
US20040133743A1 (en) * 2002-12-26 2004-07-08 Fujitsu Limited RAID apparatus and logical device expansion method thereof
JP2004213064A (ja) * 2002-12-26 2004-07-29 Fujitsu Ltd Raid装置及びその論理デバイス拡張方法
US20060047908A1 (en) * 2004-09-01 2006-03-02 Hitachi, Ltd. Disk array apparatus
JP2006072636A (ja) * 2004-09-01 2006-03-16 Hitachi Ltd ディスクアレイ装置
US20060268444A1 (en) * 2005-05-31 2006-11-30 Seagate Technology Llc High speed and high capacity data storage array

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009205630A (ja) * 2008-02-29 2009-09-10 Nec Corp フォールトトレラントサーバ、フルバックアップ方法、およびフルバックアッププログラム

Similar Documents

Publication Publication Date Title
KR100952553B1 (ko) 가상 계산기 시스템 및 그 제어 방법
US10680932B1 (en) Managing connectivity to synchronously replicated storage systems
US10606715B2 (en) Efficient high availability for a SCSI target over a fibre channel
US6732104B1 (en) Uniform routing of storage access requests through redundant array controllers
US7966449B2 (en) Distributed storage system with global replication
US7181578B1 (en) Method and apparatus for efficient scalable storage management
US6598174B1 (en) Method and apparatus for storage unit replacement in non-redundant array
JP5112003B2 (ja) ストレージ装置及びこれを用いたデータ格納方法
JP5026283B2 (ja) 協調的共用ストレージアーキテクチャ
JP5523468B2 (ja) 直接接続ストレージ・システムのためのアクティブ−アクティブ・フェイルオーバー
US6757753B1 (en) Uniform routing of storage access requests through redundant array controllers
US20030074599A1 (en) System and method for providing automatic data restoration after a storage device failure
US7984258B2 (en) Distributed storage system with global sparing
US7913038B2 (en) Distributed storage system with accelerated striping
CN103793271A (zh) 用于在镜像卷之间进行切换的方法和系统
JP2007257630A (ja) Raidストレージ・システムのパリティ値を生成する方法及びアダプタを内蔵するraidストレージ・システム(エンクロージャベースのraidパリティ支援機構)
US10768822B2 (en) Increasing storage capacity in heterogeneous storage arrays
JP4939205B2 (ja) データ記憶システムに配置された記憶アレイを再構成するための装置及び方法
JP2008033921A (ja) 加速ストライピングによる分散記憶システム
US8898514B2 (en) SAS storage device drive system with failure information table
US9027019B2 (en) Storage drive virtualization
US7818606B1 (en) Methods and apparatus for switch-initiated trespass decision making
US20060288155A1 (en) Storage-centric computer system
US10768834B2 (en) Methods for managing group objects with different service level objectives for an application and devices thereof
JP5150947B2 (ja) 広域予備化した分散記憶システム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100622

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100622

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20100622

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120404

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120626