JP4288929B2 - Data storage apparatus and data storage method - Google Patents
Data storage apparatus and data storage method Download PDFInfo
- Publication number
- JP4288929B2 JP4288929B2 JP2002324131A JP2002324131A JP4288929B2 JP 4288929 B2 JP4288929 B2 JP 4288929B2 JP 2002324131 A JP2002324131 A JP 2002324131A JP 2002324131 A JP2002324131 A JP 2002324131A JP 4288929 B2 JP4288929 B2 JP 4288929B2
- Authority
- JP
- Japan
- Prior art keywords
- storage device
- file
- moved
- stored
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 26
- 238000013500 data storage Methods 0.000 title claims description 19
- 230000008569 process Effects 0.000 claims description 16
- 238000007726 management method Methods 0.000 claims description 9
- 230000014759 maintenance of location Effects 0.000 claims description 6
- 238000013508 migration Methods 0.000 claims 2
- 230000005012 migration Effects 0.000 claims 2
- 230000006870 function Effects 0.000 description 5
- 230000007246 mechanism Effects 0.000 description 3
- 238000003672 processing method Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Description
【0001】
【発明の属する技術分野】
本発明は、例えばネットワーク上に設けられる大規模記憶装置(Network Attached Storage )に使用して好適なデータストレージ装置及びデータストレージ方法に関する。詳しくは、階層型ストレージ管理(Hierarchical Storage Management )機能を応用して、安価で大容量、かつアクセス性に優れた機器を提供できるようにしたものである。
【0002】
【従来の技術】
例えばネットワーク上に設けられる大規模記憶装置(Network Attached Storage :以下、NASと略称する)に使用して好適なデータストレージ装置としては、いわゆるハイエンドの機器とローエンドの機器が存在する。すなわち、ハイエンドの機器においては、信頼性の高いSCSIディスク等の記憶装置を用いて、高速のアクセスを可能としたものであるが、きわめて高価なものとなる。
【0003】
これに対して、ローエンドの機器においては、IDEディスク等の比較的安価な記憶装置を用いており、比較的高速のアクセスは可能であるが、信頼性に欠けるものである。従って、信頼性を確保するためには、別途にネットワーク上にバックアップ等の処置を施す必要が生じるものである。
【0004】
一方、データの管理方法として、例えば特許文献1に記載されているような階層型ストレージ管理(Hierarchical Storage Management :以下、HSMと略称する)機能が知られている。
【0005】
【特許文献1】
特開2000−148547号公報
【0006】
【発明が解決しようとする課題】
従来の階層型ストレージマネージメント(HSM)ソフトウェアにおいて、アクセス速度、容量に対する価格から、半導体メモリ→ハードディスク→リムーバブルメディア(リムーバブルディスク(MO、DVD等)→リムーバブルテープストリーマ)という階層定義が一般的であった。しかし、ハードディスクとリムーバブルメディアのアクセス性能に開きがあり、比較的サイズの小さいファイルへのアクセスにおいては、ハードディスクへの保存では容量が必要になり、リムーバブルメディアへの保存ではアクセスが遅くなるという問題があった。
【0007】
この出願はこのような点に鑑みて成されたものであって、解決しようとする問題点は、従来の装置では、ハードディスクとリムーバブルメディアのアクセス性能に開きがあり、比較的サイズの小さいファイルへのアクセスにおいては、ハードディスクへの保存では容量が必要になり、リムーバブルメディアへの保存ではアクセスが遅くなるという問題があったというものである。
【0008】
【課題を解決するための手段】
すなわち本発明においては、HSMにおいて保存先を移動する基準としている「アクセス頻度の高いファイルをなるべく安価で大容量なメディアへ移動する」ことに注目し、安価で大容量なメディアの前に、安価で信頼性が低いがアクセスが早いハードディスクをキャッシュ(セカンドキャッシュ)として採用し、リムーバブルメディアへのアクセスの不便さを補う仕組みを発明したものであって、これによれば、良好な大規模記憶装置(NAS)を構成することができる。
【0009】
【発明の実施の形態】
すなわち本発明においては、ファイルを低階層へ移動する処理方法として、
▲1▼ハードディスクからリムーバブルメディアへ移動されるファイルが、セカンドキャッシュを利用する閾値以下かを判断して、この閾値以下の場合にはセカンドキャッシュにも当該ファイルを記憶することを決定し、
▲2▼対象ファイルのデータをセカンドキャッシュとリムーバブルメディアへ移動(コピー)し、
▲3▼移動した場所の情報をデータベースに保存する。
【0010】
また、移動されたファイルへのアクセスがハードディスクへ来た時の処理方法として、
▲1▼ファイルの実体がハードディスクに存在するかチェックし、存在する場合はハードディスクから読み出し、存在しない場合は移動先から読み出す処理を起動することを決定し、
▲2▼移動先から読み出す処理において、ファイルの実体がセカンドキャッシュに存在するかチェックし、存在する場合はセカンドキャッシュから読み出し、存在しない場合は移動先のリムーバブルメディアから読み出し、
▲3▼読み出した履歴をデータベースに保存する。
【0011】
さらに、セカンドキャッシュの容量は有限であるため、その容量管理を行う処理方法として、
▲1▼セカンドキャッシュの容量管理を行い決められた使用率であるか、またはセカンドキャッシュ内のファイルが保存期間以内であるか調査し、
▲2▼閾値を越えるファイルについて削除または適切な場所へ移動し、
▲3▼削除また移動した情報をデータベースに保存する。
【0012】
以下、図面を参照して本発明を説明するに、図1は本発明によるデータストレージ装置及びデータストレージ方法を適用した大規模記憶装置(NAS)の一実施形態の構成を示すブロック図である。
【0013】
図1において、中央処理装置(CPU)1と主記憶装置(メモリ)2からなる本体装置にネットワーク接続ボード3が設けられて、このボード3を通じてネットワーク400に接続される。このネットワーク400には、任意のパーソナルコンピュータ(PC)100、200、300が接続されているものである。
【0014】
さらに、主記憶装置(メモリ)2に入出力チャネル4を介して、SCSIディスクやディスクアレイ等の高価な磁気ディスク装置5、セカンドキャッシュとなる安価な磁気ディスク装置6、及びリムーバブルメディア7が接続される。なお、上述の磁気ディスク装置6はネットワーク上に存在するホストに接続されている安価な磁気ディスク装置でもよい。また、リムーバブルメディア7はリムーバブルメディアを複数管理できるライブラリ装置でもよい。ただし、リムーバブルメディア7の記憶容量は、磁気ディスク装置6より大きいものとする。
【0015】
そして、この装置において、磁気ディスク装置5に記録されたデータを安価な磁気ディスク装置6と安価なリムーバブルメディア7を用いて、ファイルを階層構造状に配置された各ストレージデバイスへ記録・保管するシステムを考える。
【0016】
すなわち、磁気ディスク装置5に書かれたファイルが、HSMソフトウェアの基準により、低階層のストレージへ移動することが決定した時を考える。従来のHSMでは、リムーバブルメディアへファイルを移動し、磁気ディスク上にはファイルのインデックス情報等を残していた。
【0017】
これに対して、本発明では、ファイルを移動する際、図2のように対象ファイルがセカンドキャッシュを使用する条件に合った場合、リムーバブルメディアだけでなく、安価なセカンドキャッシュへ同時にコピーを保存する。
【0018】
すなわち図2において、ステップ〔1〕で、対象ファイルがセカンドキャッシュ使用対象サイズ以下であるか判断される。すなわち、ファイルサイズが大きい場合には、セカンドキャッシュとなる磁気ディスク装置6とリムーバブルメディア7とのアクセス性能が変わらなくなる。そこで、対象ファイルがセカンドキャッシュ使用対象サイズ以下でない場合(NO)には、ステップ〔2〕で対象ファイルをリムーバブルメディア7に移動(コピー)する。
【0019】
また、ステップ〔1〕で、対象ファイルがセカンドキャッシュ使用対象サイズ以下の場合(YES)には、ステップ〔3〕で、セカンドキャッシュに対象ファイルを保存できる空き容量があるか判断される。そしてない場合(NO)には、ステップ〔4〕でセカンドキャッシュ内のファイル管理機能により、セカンドキャッシュに空き容量を確保する。
【0020】
さらに、ステップ〔3〕でセカンドキャッシュに対象ファイルを保存できる空き容量があった場合(YES)と、ファイル管理機能によりセカンドキャッシュに空き容量が確保されると、ステップ〔5〕で、対象ファイルをセカンドキャッシュ及びリムーバブルメディア7に移動(コピー)する。
【0021】
そして、上述のステップ〔2〕及びステップ〔5〕が終了すると、ステップ〔6〕で、ファイルの移動先情報を主記憶装置(メモリ)2等のデータベースに登録し、管理を行う。このようにして、磁気ディスク装置5に書かれたファイルのセカンドキャッシュ(磁気ディスク装置6)及びリムーバブルメディア7への移動(コピー)が行われる。
【0022】
次に、磁気ディスクへファイルのアクセスがあった場合、図3のように処理が行われる。すなわち図3において、ステップ〔11〕で対象ファイルの実体がハードディスク(磁気ディスク装置5)上に存在するか判断される。そして存在する場合(YES)は、ステップ〔12〕で対象ファイルはそのままハードディスクから読み出される。
【0023】
また、ステップ〔11〕で対象ファイルの実体がハードディスク(磁気ディスク装置5)上に存在しない場合(NO)は、ステップ〔13〕で対象ファイルがセカンドキャッシュ(磁気ディスク装置7)上に存在するか判断される。そして存在する場合(YES)は、ステップ〔14〕でセカンドキャッシュが使用可能か判断され、使用可能のとき(YES)は、ステップ〔15〕で対象ファイルをセカンドキャッシュから読み出し、ハードディスクへ戻す処理が行われる。
【0024】
また、ステップ〔13〕で対象ファイルがセカンドキャッシュ(磁気ディスク装置7)上に存在しない場合(NO)と、ステップ〔14〕でセカンドキャッシュが使用可能でないとき(NO)は、ステップ〔16〕で対象ファイルをリムーバブルメディアから読み出し、ハードディスクへ戻す処理が行われる。
【0025】
さらに、ステップ〔12〕、〔15〕、〔16〕が終了すると、ステップ〔17〕で、読み出した履歴を主記憶装置(メモリ)2等のデータベースに保存し、管理を行う。
【0026】
これにより、磁気ディスクにファイルの実体が存在していればそのまま磁気ディスクからファイルを読み込むことができる。また、磁気ディスク上にインデックス情報しかない場合、磁気ディスクへファイルの実体を戻す処理を行う。この時、リムーバブルメディアへアクセスする前にセカンドキャッシュに対象ファイルが存在するか確認し、セカンドキャッシュに存在すればそこからファイルを読み出し、磁気ディスクへファイルの実体を戻す。
【0027】
また、セカンドキャッシュに存在しなければ、従来同様にリムーバブルメディアから読み出し磁気ディスクへファイルの実体を戻す。さらに、セカンドキャッシュに存在するが、セカンドキャッシュがアクセス不可能である場合、従来通りリムーバブルメディアから読み出す。このようにして、磁気ディスクへファイルのアクセスがあった場合の処理が行われる。
【0028】
また、セカンドキャッシュの容量は有限であるため、セカンドキャッシュの容量管理が必要になる。図4のようにセカンドキャッシュの容量管理を行う処理を定義し、必要に応じてセカンドキャッシュ内のファイルを削除または適切な場所へ移動を行う。なお、この処理は常に実行されているものである。
【0029】
すなわち図4において、ステップ〔21〕では、セカンドキャッシュの磁気ディスクの使用状況をチェックする。次にステップ〔22〕では、セカンドキャッシュの使用率が決められた閾値以上か判断される。そして、閾値以上のとき(YES)は、ステップ〔23〕でアクセス頻度の低い順、または最新アクセス時間の古い順にファイルを削除、または適切な場所に移動する。
【0030】
また、ステップ〔22〕でセカンドキャッシュの使用率が決められた閾値以上でないとき(NO)は、ステップ〔24〕でセカンドキャッシュ上に保存期間を越えたファイルが存在するか判断される。そして、存在するとき(YES)は、ステップ〔25〕で対象ファイルを削除する。
【0031】
さらに、ステップ〔24〕でセカンドキャッシュ上に保存期間を越えたファイルが存在しないとき(NO)と、ステップ〔23〕、〔25〕が終了すると、ステップ〔26〕で、削除または移動したファイルの状況を主記憶装置(メモリ)2等のデータベースに登録する。このようにして、セカンドキャッシュの容量管理が行われる。
【0032】
また、セカンドキャッシュは安価ではあるが、信頼性も低いことを前提としているため、ハードウェアのトラブルにより使用不可能になる可能性がある。その場合、セカンドキャッシュのハードウェアを復旧後、図5の処理にしたがい、必要なファイルをリムーバブルメディアから復旧することで欠点を補うものとする。
【0033】
すなわち図5において、ステップ〔31〕では、一度使用できなくなったセカンドキャッシュがアクセス可能か判断され、セカンドキャッシュとなる磁気ディスク装置6が交換されるまで待機される。そして交換が行われて、アクセス可能か判断されたとき(YES)は、ステップ〔32〕でセカンドキャッシュに本来存在すべきファイルがすべてあるか判断される。
【0034】
さらに、ステップ〔32〕でファイルがすべてあると判断されなかったとき(NO)は、ステップ〔33〕で必要なファイルをリムーバブルメディアより復旧する処理が行われる。また、ステップ〔32〕でファイルがすべてあると判断されたとき(YES)と、ステップ〔33〕が終了すると、ステップ〔34〕で、セカンドキャッシュが復旧していることを主記憶装置(メモリ)2等のデータベースに登録する。このようにして、セカンドキャッシュの交換時の管理が行われる。
【0035】
こうして、本発明によれば、HSMソフトウェアにおいて、以下の点が大幅に改善される。
▲1▼アクセス頻度の高い、または最近アクセスされたファイルに対して、アクセス速度をあげるため、1次記憶用の高価な磁気ディスク容量への投資をさげることができる。
▲2▼セカンドキャッシュがハードドラブル等によりアクセス不可能になった場合でも、従来のHSM 機能により、リムーバブルメディアからファイルの復元が可能である。
▲3▼必要に応じて安価なセカンドキャッシュを追加することにより、安価にアクセス速度の早い領域を拡張することが可能になる。またこの時システムの運用をほぼ止めることなく容量拡張が可能になる。
▲4▼セカンドキャッシュを使用するファイルサイズの閾値を設定することにより、小さなファイルを頻繁にアクセスするシステムにおいてもHSMの効果を利用することが可能になる。
【0036】
従ってこの実施形態において、HSMにおいて保存先を移動する基準としている「アクセス頻度の高いファイルをなるべく安価で大容量なメディアへ移動する」ことに注目し、安価で大容量なメディアの前に、安価で信頼性が低いがアクセスが早いハードディスクをキャッシュ(セカンドキャッシュ)として採用し、リムーバブルメディアへのアクセスの不便さを補う仕組みを発明したことによって、良好な大規模記憶装置(NAS)を構成することができる。
【0037】
これによって、従来の装置では、ハードディスクとリムーバブルメディアのアクセス性能に開きがあり、比較的サイズの小さいファイルへのアクセスにおいては、ハードディスクへの保存では容量が必要になり、リムーバブルメディアへの保存ではアクセスが遅くなるという問題があったものを、本発明によればこれらの問題点を容易に解消することができるものである。
【0038】
なお本発明は、上述の説明した実施の形態に限定されるものではなく、本発明の精神を逸脱することなく種々の変形が可能とされるものである。
【0039】
【発明の効果】
従って発明によれば、HSMにおいて保存先を移動する基準としている「アクセス頻度の高いファイルをなるべく安価で大容量なメディアへ移動する」ことに注目し、安価で大容量なメディアの前に、安価で信頼性が低いがアクセスが早いハードディスクをキャッシュ(セカンドキャッシュ)として採用し、リムーバブルメディアへのアクセスの不便さを補う仕組みを発明したことによって、良好な大規模記憶装置(NAS)を構成することができるものである。
【0040】
これによって、従来の装置では、ハードディスクとリムーバブルメディアのアクセス性能に開きがあり、比較的サイズの小さいファイルへのアクセスにおいては、ハードディスクへの保存では容量が必要になり、リムーバブルメディアへの保存ではアクセスが遅くなるという問題があったものを、本発明によればこれらの問題点を容易に解消することができるものである。
【図面の簡単な説明】
【図1】本発明によるデータストレージ装置及びデータストレージ方法を適用した大規模記憶装置(NAS)の一実施形態の構成を示すブロック図である。
【図2】その動作の説明のためのフローチャート図である。
【図3】その動作の説明のためのフローチャート図である。
【図4】その動作の説明のためのフローチャート図である。
【図5】その動作の説明のためのフローチャート図である。
【符号の説明】
1…中央処理装置(CPU)、2…主記憶装置(メモリ)、3…ネットワーク接続ボード、400…ネットワーク、100,200,300…パーソナルコンピュータ(PC)、4…入出力チャネル、5…SCSIディスクやディスクアレイ等の高価な磁気ディスク装置、6…セカンドキャッシュとなる安価な磁気ディスク装置、7…リムーバブルメディア[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a data storage device and a data storage method suitable for use in, for example, a large-scale storage device (Network Attached Storage) provided on a network. Specifically, the Hierarchical Storage Management function is applied to provide an inexpensive, large-capacity device with excellent accessibility.
[0002]
[Prior art]
For example, there are so-called high-end devices and low-end devices as data storage devices suitable for use in a large-scale storage device (Network Attached Storage: hereinafter abbreviated as NAS) provided on a network. That is, in a high-end device, high-speed access is possible using a storage device such as a highly reliable SCSI disk, but it is extremely expensive.
[0003]
On the other hand, a low-end device uses a relatively inexpensive storage device such as an IDE disk and can be accessed at a relatively high speed, but lacks reliability. Therefore, in order to ensure reliability, it is necessary to separately perform a backup process or the like on the network.
[0004]
On the other hand, as a data management method, for example, a hierarchical storage management (hereinafter abbreviated as HSM) function as described in
[0005]
[Patent Document 1]
Japanese Patent Laid-Open No. 2000-148547 [0006]
[Problems to be solved by the invention]
In conventional hierarchical storage management (HSM) software, the hierarchical definition of semiconductor memory → hard disk → removable media (removable disk (MO, DVD, etc.) → removable tape streamer) is common because of the price for access speed and capacity. . However, there is a difference in the access performance of the hard disk and removable media, and access to a relatively small file requires more space for storage on the hard disk, and access to the removable media slows access. there were.
[0007]
This application has been made in view of the above points, and the problem to be solved is that, in the conventional apparatus, there is a difference in the access performance of the hard disk and the removable medium, and the file has a relatively small size. In the case of access, there is a problem that storage is required for storage on a hard disk and access is slow when storage is performed on a removable medium.
[0008]
[Means for Solving the Problems]
That is, in the present invention, paying attention to “move frequently accessed files to as cheap and large-capacity media as possible”, which is the standard for moving the storage destination in the HSM, and before the cheap and large-capacity media, Inventing a mechanism that compensates for the inconvenience of accessing removable media by adopting a hard disk that is low in reliability and quick to access as a cache (second cache). (NAS) can be configured.
[0009]
DETAILED DESCRIPTION OF THE INVENTION
That is, in the present invention, as a processing method for moving a file to a lower hierarchy,
(1) It is determined whether the file to be transferred from the hard disk to the removable medium is below the threshold for using the second cache . If the file is below this threshold, it is decided to store the file in the second cache,
(2) Move (copy) the target file data to the second cache and removable media.
(3) Information on the moved location is stored in the database.
[0010]
In addition, as a processing method when access to the moved file comes to the hard disk,
(1) Check whether the actual file exists on the hard disk, and if it exists, decide to start the process of reading from the hard disk, and if not, starting from the destination.
(2) In the process of reading from the move destination, it is checked whether the file entity exists in the second cache. If it exists , the file is read from the second cache. If not , the file is read from the removable medium at the move destination.
(3) Save the read history in the database.
[0011]
Furthermore, since the capacity of the second cache is finite, as a processing method for managing the capacity,
(1) Investigate whether the usage rate is determined by managing the capacity of the second cache, or whether the file in the second cache is within the retention period,
(2) Delete files that exceed the threshold or move them to an appropriate location.
(3) The deleted or moved information is stored in the database.
[0012]
Hereinafter, the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration of an embodiment of a large-scale storage device (NAS) to which a data storage device and a data storage method according to the present invention are applied.
[0013]
In FIG. 1, a
[0014]
Further, an expensive
[0015]
In this device, a system for recording / storing data recorded on the
[0016]
That is, consider a case where it is determined that a file written in the
[0017]
On the other hand, in the present invention, when moving a file, if the target file meets the conditions for using the second cache as shown in FIG. 2, a copy is simultaneously saved not only on the removable medium but also on an inexpensive second cache. .
[0018]
That is, in FIG. 2, it is determined in step [1] whether the target file is smaller than the second cache use target size. That is, when the file size is large, the access performance between the
[0019]
In step [1], if the target file is equal to or smaller than the second cache use target size (YES), it is determined in step [3] whether there is enough free space in the second cache to store the target file. If not (NO), a free capacity is secured in the second cache by the file management function in the second cache in step [4].
[0020]
Further, when there is free space that can store the target file in the second cache in step [3] (YES), and when free space is secured in the second cache by the file management function, in step [5], the target file is stored. Move (copy) to the second cache and removable media 7.
[0021]
When step [2] and step [5] are completed, in step [6], the file move destination information is registered in a database such as main memory (memory) 2 and managed. In this manner, the file written in the
[0022]
Next, when a file is accessed to the magnetic disk, processing is performed as shown in FIG. That is, in FIG. 3, it is determined in step [11] whether the object file exists on the hard disk (magnetic disk device 5). If it exists (YES), the target file is read from the hard disk as it is in step [12].
[0023]
If the target file does not exist on the hard disk (magnetic disk device 5) at step [11] (NO), whether the target file exists on the second cache (magnetic disk device 7) at step [13]. To be judged. If it exists (YES), it is determined in step [14] whether or not the second cache can be used. If it can be used (YES), the target file is read from the second cache and returned to the hard disk in step [15]. Done.
[0024]
If the target file does not exist on the second cache (magnetic disk device 7) in step [13] (NO), and if the second cache is not usable in step [14] (NO), then in step [16]. The target file is read from the removable medium and returned to the hard disk.
[0025]
Further, when Steps [12], [15], and [16] are completed, the read history is stored in a database such as the main storage device (memory) 2 and managed in Step [17].
[0026]
Thereby, if the file entity exists on the magnetic disk, the file can be read from the magnetic disk as it is. If there is only index information on the magnetic disk, a process of returning the file entity to the magnetic disk is performed. At this time, it is confirmed whether the target file exists in the second cache before accessing the removable medium. If the target file exists in the second cache, the file is read from the second cache and the substance of the file is returned to the magnetic disk.
[0027]
If it does not exist in the second cache, the file entity is read from the removable medium and returned to the magnetic disk as in the prior art. Further, if the second cache is inaccessible but is not accessible, it is read from the removable medium as usual. In this way, processing when a file is accessed to the magnetic disk is performed.
[0028]
Further, since the capacity of the second cache is finite, it is necessary to manage the capacity of the second cache. As shown in FIG. 4, a process for managing the capacity of the second cache is defined, and a file in the second cache is deleted or moved to an appropriate location as necessary. This process is always executed.
[0029]
That is, in FIG. 4, in step [21], the usage status of the second cache magnetic disk is checked. Next, in step [22], it is determined whether the usage rate of the second cache is equal to or greater than a predetermined threshold value. If it is equal to or greater than the threshold (YES), in step [23], the file is deleted or moved to an appropriate place in the order of low access frequency or oldest access time.
[0030]
When the usage rate of the second cache is not equal to or greater than the threshold value determined in step [22] (NO), it is determined in step [24] whether there is a file that has exceeded the storage period in the second cache. If it exists (YES), the target file is deleted in step [25].
[0031]
Furthermore, when there is no file whose retention period has been exceeded in the second cache in step [24] (NO), and when steps [23] and [25] are completed, in step [26] the file deleted or moved The status is registered in a database such as the main memory (memory) 2. In this way, the capacity management of the second cache is performed.
[0032]
The second cache is premised on being inexpensive but having low reliability, and may become unusable due to a hardware problem. In this case, after the second cache hardware is recovered, the necessary file is recovered from the removable medium in accordance with the processing shown in FIG.
[0033]
That is, in FIG. 5, in step [31], it is determined whether the second cache that has become unusable once can be accessed, and the system waits until the
[0034]
Further, when it is determined in step [32] that all the files are not present (NO), processing for recovering the necessary files from the removable medium is performed in step [33]. When it is determined in step [32] that all files are present (YES), and when step [33] is completed, it is determined in step [34] that the second cache has been restored to the main memory (memory). Register in the second database. In this way, management at the time of replacement of the second cache is performed.
[0035]
Thus, according to the present invention, the following points are greatly improved in the HSM software.
(1) In order to increase the access speed for a frequently accessed file or a recently accessed file, investment in an expensive magnetic disk capacity for primary storage can be reduced.
(2) Even if the second cache becomes inaccessible due to hard dubbing, etc., files can be restored from removable media using the conventional HSM function.
(3) By adding an inexpensive second cache as necessary, it is possible to expand an area with a high access speed at a low cost. At this time, the capacity can be expanded almost without stopping the operation of the system.
(4) By setting a file size threshold value that uses a second cache, the effect of HSM can be used even in a system that frequently accesses small files.
[0036]
Therefore, in this embodiment, paying attention to “move frequently accessed files to as cheap and large capacity media as possible”, which is the standard for moving the storage destination in HSM, and before the cheap and large capacity media, By adopting a mechanism that compensates for the inconvenience of accessing removable media by adopting a hard disk that is low in reliability and quick to access as a cache (second cache), and constructing a good large-scale storage device (NAS) Can do.
[0037]
As a result, the access performance of the hard disk and the removable media is greatly different in the conventional device. Access to a relatively small file requires a capacity for storage on the hard disk, and access for storage on the removable media. However, according to the present invention, these problems can be easily solved.
[0038]
Note that the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the spirit of the present invention.
[0039]
【The invention's effect】
Therefore, according to the invention, paying attention to “move frequently accessed files to as low-cost and large-capacity media as possible” which is the standard for moving the storage destination in HSM By adopting a mechanism that compensates for the inconvenience of accessing removable media by adopting a hard disk that is low in reliability and quick to access as a cache (second cache), and constructing a good large-scale storage device (NAS) It is something that can be done.
[0040]
As a result, the access performance of the hard disk and the removable media is greatly different in the conventional device. Access to a relatively small file requires a capacity for storage on the hard disk, and access for storage on the removable media. However, according to the present invention, these problems can be easily solved.
[Brief description of the drawings]
FIG. 1 is a block diagram showing a configuration of an embodiment of a large-scale storage device (NAS) to which a data storage device and a data storage method according to the present invention are applied.
FIG. 2 is a flowchart for explaining the operation.
FIG. 3 is a flowchart for explaining the operation.
FIG. 4 is a flowchart for explaining the operation.
FIG. 5 is a flowchart for explaining the operation.
[Explanation of symbols]
DESCRIPTION OF
Claims (6)
比較的高速でのアクセスが可能な第2の記憶装置と、
比較的低速だが大容量の記憶を行うことのできる第3の記憶装置と、
を有し、
前記第1の記憶装置から、前記第3記憶装置への移動の決まったファイルの移動処理として、
▲1▼前記第1の記憶装置から前記第3の記憶装置へ移動されるファイルの大きさが閾値以下かを判断して、閾値以下の場合には前記第2の記憶装置にも記憶することを決定し、
▲2▼前記ファイルを前記第2の記憶装置と第3の記憶装置の両方に移動し、
▲3▼前記移動した場所の情報をデータベースに保存し、前記移動されたファイルへのアクセスが行われたときの処理として、
▲1▼前記アクセスされたファイルが前記第1の記憶装置に存在するかを判別し、存在するときは前記第1の記憶装置から読み出し、存在しないときは移動先から読み出す処理を起動することを決定し、
▲2▼移動先から読み出す処理において、前記アクセスされたファイルが前記第2の記憶装置に存在するかを判別し、存在するときは前記第2の記憶装置から読み出し、存在しないときは前記第3の記憶装置から読み出し、
▲3▼前記読み出した履歴をデータベースに保存し、前記の処理を行う手段を設けた
データストレージ装置。A first storage device provided with a means for increasing reliability;
A second storage device capable of relatively high speed access;
A third storage device that is relatively slow but capable of storing large volumes;
Have
As a process of moving a file determined to be moved from the first storage device to the third storage device ,
(1) It is determined whether the size of a file to be moved from the first storage device to the third storage device is less than a threshold value, and if it is less than the threshold value, it is also stored in the second storage device. Decide
(2) Move the file to both the second storage device and the third storage device,
(3) Information on the moved location is stored in a database, and processing when the moved file is accessed is as follows:
(1) It is determined whether or not the accessed file exists in the first storage device. When the file exists, reading from the first storage device is started, and when it does not exist, a process of reading from the destination is started. Decide
(2) In the process of reading from the migration destination, it is determined whether the accessed file exists in the second storage device. If the file exists, the file is read from the second storage device, and if not, the third file is read. Read from the storage device,
(3) A means for storing the read history in a database and performing the above processing is provided .
Data storage devices.
さらに前記第2の記憶装置の容量管理のための処理として、
▲1▼前記第2の記憶装置の容量の使用率が所定範囲内であるかを判断すると共に、前記第2の記憶装置に記憶されたファイルの保存期間内であるかを調査し、
▲2▼前記使用率が閾値を越えているときに前記保存期間を越えているファイルについて削除または適切な場所への移動を行い、
▲3▼前記削除または移動した情報をデータベースに保存し、前記の処理を行う手段を設けた
データストレージ装置。The data storage device according to claim 1, wherein
Further, as a process for capacity management of the second storage device,
(1) It is determined whether the usage rate of the capacity of the second storage device is within a predetermined range, and whether it is within the retention period of the file stored in the second storage device,
(2) When the usage rate exceeds the threshold value, the file exceeding the retention period is deleted or moved to an appropriate location.
(3) A means for storing the deleted or moved information in a database and performing the above processing is provided .
Data storage devices.
前記第2の記憶装置を交換した際の処理として、
▲1▼前記第2の記憶装置が使用可能であるかを判断し、
▲2▼前記第2の記憶装置に保存すべきファイルがすべて保存されているかを判断して、保存されていないときは前記第3の記憶装置からファイルの復旧を行い、
▲3▼前記第2の記憶装置に保存すべきファイルがすべて復旧した情報をデータベースに保存し、前記の処理を行う手段を設けた
データストレージ装置。The data storage device according to claim 1, wherein
As a process when the second storage device is replaced,
(1) Determine whether the second storage device is usable,
(2) Determine whether all the files to be stored in the second storage device are stored. If not, restore the files from the third storage device.
(3) There is provided means for storing in the database information that all the files to be stored in the second storage device have been restored and performing the above processing .
Data storage devices.
▲1▼前記第1の記憶装置から、前記第3の記憶装置へ移動されるファイルの大きさが閾値以下かを判断して、閾値以下の場合には比較的高速でのアクセスが可能な第2の記憶装置にも記憶することを決定し、
▲2▼前記ファイルを前記第2の記憶装置と比較的低速だが大容量の記憶を行うことのできる第3の記憶装置の両方に移動し、
▲3▼前記移動した場所の情報をデータベースに保存し、前記移動されたファイルへのアクセスが行われたときの処理として、
▲1▼前記アクセスされたファイルが前記第1の記憶装置に存在するかを判別し、存在するときは前記第1の記憶装置から読み出し、存在しないときは移動先から読み出す処理を起動することを決定し、
▲2▼移動先から読み出す処理において、前記アクセスされたファイルが前記第2の記憶装置に存在するかを判別し、存在するときは前記第2の記憶装置から読み出し、存在しないときは前記第3の記憶装置から読み出し、
▲3▼前記読み出した履歴をデータベースに保存する
こデータストレージ方法。As a process of moving a file that has been determined to be moved from the first storage device with the means for improving the reliability to the third storage device ,
(1) It is determined whether the size of a file to be moved from the first storage device to the third storage device is equal to or smaller than a threshold value . It decided to store in the second storage device,
(2) Move the file to both the second storage device and a third storage device capable of storing a relatively large amount of data,
(3) Information on the moved location is stored in a database, and processing when the moved file is accessed is as follows:
(1) It is determined whether or not the accessed file exists in the first storage device. When the file exists, reading from the first storage device is started, and when it does not exist, a process of reading from the destination is started. Decide
(2) In the process of reading from the migration destination, it is determined whether the accessed file exists in the second storage device. If the file exists, the file is read from the second storage device, and if not, the third file is read. Read from the storage device,
(3) Save the read history in the database
This data storage method.
さらに前記第2の記憶装置の容量管理のための処理として、
▲1▼前記第2の記憶装置の容量の使用率が所定範囲内であるかを判断すると共に、前記第2の記憶装置に記憶されたファイルの保存期間内であるかを調査し、
▲2▼前記使用率が閾値を越えているときに前記保存期間を越えているファイルについて削除または適切な場所への移動を行い、
▲3▼前記削除または移動した情報をデータベースに保存する
データストレージ方法。The data storage method according to claim 4, wherein
Further, as a process for capacity management of the second storage device,
(1) It is determined whether the usage rate of the capacity of the second storage device is within a predetermined range, and whether it is within the retention period of the file stored in the second storage device,
(2) When the usage rate exceeds the threshold value, the file exceeding the retention period is deleted or moved to an appropriate location.
▲ 3 ▼ save the deleted or moved the information in the database
Data storage method.
前記第2の記憶装置を交換した際の処理として、
▲1▼前記第2の記憶装置が使用可能であるかを判断し、
▲2▼前記第2の記憶装置に保存すべきファイルがすべて保存されているかを判断して、保存されていないときは前記第3の記憶装置からファイルの復旧を行い、
▲3▼前記第2の記憶装置に保存すべきファイルがすべて復旧した情報をデータベースに保存する
データストレージ方法。The data storage method according to claim 4, wherein
As a process when the second storage device is replaced,
(1) Determine whether the second storage device is usable,
(2) Determine whether all the files to be stored in the second storage device are stored. If not, restore the files from the third storage device.
▲ 3 ▼ save the information to which the second file to be stored in the storage device is restored all databases
Data storage method.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002324131A JP4288929B2 (en) | 2002-11-07 | 2002-11-07 | Data storage apparatus and data storage method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002324131A JP4288929B2 (en) | 2002-11-07 | 2002-11-07 | Data storage apparatus and data storage method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004157859A JP2004157859A (en) | 2004-06-03 |
JP4288929B2 true JP4288929B2 (en) | 2009-07-01 |
Family
ID=32803817
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002324131A Expired - Fee Related JP4288929B2 (en) | 2002-11-07 | 2002-11-07 | Data storage apparatus and data storage method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4288929B2 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4477681B2 (en) | 2008-03-06 | 2010-06-09 | 富士通株式会社 | Hierarchical storage device, control device, and control method |
WO2013102962A1 (en) * | 2012-01-04 | 2013-07-11 | 日本電気株式会社 | Cache device, cache replacement method, and non-temporary computer-readable medium |
-
2002
- 2002-11-07 JP JP2002324131A patent/JP4288929B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004157859A (en) | 2004-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6708929B2 (en) | Storage control device, storage system, and storage control program | |
US7743206B2 (en) | Dynamic loading of virtual volume data in a virtual tape server | |
US8478729B2 (en) | System and method for controlling the storage of redundant electronic files to increase storage reliability and space efficiency | |
US8112679B2 (en) | Data reliability bit storage qualifier and logical unit metadata | |
US8745011B2 (en) | Method and system for scrubbing data within a data storage subsystem | |
KR101769448B1 (en) | Method and apparatus for performing annotated atomic write operations | |
US8108597B2 (en) | Storage control method and system for performing backup and/or restoration | |
US20090100223A1 (en) | Storage control apparatus, data archive method for storage control apparatus, and storage system | |
US20090157756A1 (en) | File System For Storing Files In Multiple Different Data Storage Media | |
JP4402103B2 (en) | Data storage device, data relocation method thereof, and program | |
WO2002027526A1 (en) | Fast data retrieval based upon contiguous consolidation of records according to frequency of access | |
JP2002207620A (en) | File system and data caching method of the same system | |
US7308543B2 (en) | Method and system for shredding data within a data storage subsystem | |
JP2013143124A (en) | Method for perpetuating meta data | |
CN109902034B (en) | Snapshot creating method and device, electronic equipment and machine-readable storage medium | |
WO2019181949A1 (en) | Recording device, reading device, recording method, recording program, reading method, reading program and magnetic tape | |
US8140886B2 (en) | Apparatus, system, and method for virtual storage access method volume data set recovery | |
JP6642495B2 (en) | Storage management system | |
US20060041789A1 (en) | Storage system with journaling | |
WO2013174166A1 (en) | Method for high performance dump data set creation | |
JP2005267599A (en) | Data write protection in a mixed storage area network and network attached storage environment | |
JP4288929B2 (en) | Data storage apparatus and data storage method | |
JP2005165485A (en) | File management device, storage management system, system management method, program, and recording medium | |
JP2000148404A (en) | Computer system | |
JP2001101039A (en) | Hierarchical storage management device |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20051018 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20051018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081211 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081216 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090209 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090310 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090323 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120410 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |