[go: up one dir, main page]

JP2012008854A - Storage virtualization device - Google Patents

Storage virtualization device Download PDF

Info

Publication number
JP2012008854A
JP2012008854A JP2010145019A JP2010145019A JP2012008854A JP 2012008854 A JP2012008854 A JP 2012008854A JP 2010145019 A JP2010145019 A JP 2010145019A JP 2010145019 A JP2010145019 A JP 2010145019A JP 2012008854 A JP2012008854 A JP 2012008854A
Authority
JP
Japan
Prior art keywords
data
storage
user
virtualization apparatus
file
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010145019A
Other languages
Japanese (ja)
Inventor
Koji Matsumoto
浩司 松本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2010145019A priority Critical patent/JP2012008854A/en
Publication of JP2012008854A publication Critical patent/JP2012008854A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】ユーザが保存する情報は、同じデータやファイルをユーザ毎に個別に保存しているケースが多く見られる。このため、管理者は、ストレージには同じデータが複数箇所に重複保存されているものの、ユーザが異なるため共有化/削除する事もできず、余分なストレージエリアを消費している。本発明は、データ重複除外機能を利用してリソース効率化が可能となるストレージ仮想化装置の新たな機能を生み出す。
【解決手段】ストレージ仮想化装置は、配下のデータの同一性をチェックし、同一データがあれば、1データのみ特定のストレージエリアに移動させ代表データとし、それ以外のデータは削除する。但し、ユーザ毎に本ファイルを用意する必要があるため、代表実データと、各ユーザ上の仮想化エリア上の仮想ファイルとマッピングさせて、参照できるようにする。
【選択図】図3
Information stored by a user often has the same data and files stored individually for each user. For this reason, although the same data is repeatedly stored in a plurality of locations in the storage, the administrator cannot share / delete because the user is different, and consumes an extra storage area. The present invention creates a new function of a storage virtualization apparatus that enables resource efficiency using the data deduplication function.
A storage virtualization apparatus checks the identity of subordinate data, and if there is identical data, only one data is moved to a specific storage area as representative data, and other data is deleted. However, since it is necessary to prepare this file for each user, the representative actual data and the virtual file on the virtualization area on each user are mapped so that they can be referred to.
[Selection] Figure 3

Description

本発明は、ストレージ仮想化装置に係り、特にデータの持つ価値に応じて適材適所の保存場所を選ぶストレージ仮想化装置に関する。   The present invention relates to a storage virtualization apparatus, and more particularly to a storage virtualization apparatus that selects an appropriate storage location according to the value of data.

ストレージ仮想化装置は、データの持つ価値に応じて適材適所の保存場所を選ぶ階層的な配置を実現できる。
特許文献1は、重複したファイルのインデックス情報作成処理を抑圧するストレージシステムを開示している。
The storage virtualization apparatus can realize a hierarchical arrangement that selects the right storage location according to the value of data.
Patent Document 1 discloses a storage system that suppresses index information creation processing of duplicate files.

ユーザが保存する情報は、同じデータやファイルをユーザ毎に個別に保存しているケースが多く見られる。このため、管理者は、ストレージには同じデータが複数箇所に重複保存されているものの、ユーザが異なるため共有化/削除する事もできず、余分なストレージエリアを消費している。   In many cases, the information stored by the user stores the same data or file individually for each user. For this reason, although the same data is repeatedly stored in a plurality of locations in the storage, the administrator cannot share / delete because the user is different, and consumes an extra storage area.

これを図1を参照して、ストレージシステム400を説明する。図1において、ストレージシステム400は、ストレージ仮想化装置200と、仮想ストレージ300と、複数のユーザ端末100とから構成される。仮想ストレージ300は、複数の物理ストレージ300a、300b、300cから構成される。物理ストレージ300aは、ユーザ端末100−Aのファイルを保存する。物理ストレージ300bは、ユーザ端末100−Bのファイルを保存する。物理ストレージ300cは、ユーザ端末100−Cのファイルを保存する。   The storage system 400 will be described with reference to FIG. In FIG. 1, the storage system 400 includes a storage virtualization apparatus 200, a virtual storage 300, and a plurality of user terminals 100. The virtual storage 300 includes a plurality of physical storages 300a, 300b, and 300c. The physical storage 300a stores the file of the user terminal 100-A. The physical storage 300b stores the file of the user terminal 100-B. The physical storage 300c stores the file of the user terminal 100-C.

ユーザ端末100−Aの保存ファイルは、ファイルAとファイルBである。ユーザ端末100−Bの保存ファイルは、ファイルAとファイルCである。ユーザ端末100−Cの保存ファイルは、ファイルAとファイルDである。すなわちファイルAは、同一内容にも関わらず3本、仮想ストレージに記憶されている。   The saved files of the user terminal 100-A are file A and file B. The saved files of the user terminal 100-B are file A and file C. The saved files of the user terminal 100-C are file A and file D. That is, three files A are stored in the virtual storage regardless of the same contents.

ストレージ仮想化装置200は、ユーザに仮想レイヤであるグローバルネームスペース210を提供する。ここで、グローバルネームスペース210とは、すべてにまたがる単一の論理的な名前空間のことである。グローバルネームスペース210を使うことで、ユーザや管理者は、ファイルにアクセスする際に、物理的なストレージのディレクトリ名を指定する必要がなくなる。グローバルネームスペース210は、部署名などの論理的な分類によってデータを管理する。グローバルネームスペース210は、データの物理的な位置に左右されない一貫したデータ管理を提供する。   The storage virtualization apparatus 200 provides the user with a global namespace 210 that is a virtual layer. Here, the global namespace 210 is a single logical namespace that spans all. Using the global namespace 210 eliminates the need for a user or administrator to specify a physical storage directory name when accessing a file. The global namespace 210 manages data according to a logical classification such as a department name. Global namespace 210 provides consistent data management independent of the physical location of the data.

特開2008−158993号公報JP 2008-159933 A

ユーザデータを保存するストレージにおいて、ITコストの削減が訴求されている。この理由は、現状のストレージが初期投資時に将来を見越した大容量装置を導入するため、利用効率が悪く、かつ初期投資に膨大なコストが掛かるからである。これを改善するため柔軟なスケールアウトや、ストレージの効率的な利用方法が必要とされている。   In storage for storing user data, reduction of IT costs has been urged. This is because the current storage introduces a large-capacity device that anticipates the future at the time of the initial investment, so that the utilization efficiency is poor and the initial investment costs enormous costs. In order to improve this, flexible scale-out and efficient use of storage are required.

本発明は、ストレージ仮想化装置配下のデータの同一性をチェックし、同一データがあれば、データ1つのみを特定のストレージエリアに移動させ代表データとし、それ以外のデータは削除する。但し、ユーザ毎に本ファイルを用意する必要があるため、ストレージ仮想化装置にて、各ユーザエリア上に仮想ファイルがあると思わせるため、その仮想データの保存先と代表実データの保存先とをマッピングさせて、参照できるようにする。   In the present invention, the identity of data under the storage virtualization apparatus is checked. If there is identical data, only one data is moved to a specific storage area as representative data, and other data is deleted. However, since it is necessary to prepare this file for each user, the storage virtualization device makes it seem that there is a virtual file on each user area. Is mapped so that it can be referenced.

上述した課題は、ストレージに接続され、パス情報を制御するパス制御部と、ストレージ上の仮想/物理マッピング情報の紐付けを行なう仮想/物理紐付け制御部と、代表データが保存されている実パスと、仮想/物理マッピング情報の紐付けを行なう重複情報紐付け制御部と、ユーザ情報閲覧のリクエストが来たとき、代表データをユーザに閲覧させる重複情報検索部とからなるストレージ仮想化装置であって、ストレージに移行された新規データの特徴を抽出し、既存データの特徴と比較し、合致する既存データがあるとき、新規データを仮想ファイルとして登録し、仮想ファイル場所と既存データの代表データ場所とをマッピングし、新規データを削除するストレージ仮想化装置により、達成できる。   The above-mentioned problems are that the path control unit connected to the storage and controls the path information, the virtual / physical association control unit that associates the virtual / physical mapping information on the storage, and the representative data are stored. A storage virtualization device that includes a duplicate information linking control unit that links a path and virtual / physical mapping information, and a duplicate information search unit that allows a user to browse representative data when a user information browsing request is received. Then, the feature of the new data transferred to the storage is extracted, compared with the feature of the existing data, and when there is a matching existing data, the new data is registered as a virtual file, the virtual file location and the representative data of the existing data This can be achieved by a storage virtualization device that maps locations and deletes new data.

本発明によれば、ユーザが参照している仮想ストレージ容量以上のデータを物理ストレージ上に保存する事が可能になる。また、既存のストレージに比べて、物理容量が削減できることから、購入すべき物理ストレージの台数や容量を減らす事が可能となり、コストの削減に繋がる。   According to the present invention, it is possible to save data on the physical storage that is larger than the virtual storage capacity referenced by the user. In addition, since the physical capacity can be reduced compared to the existing storage, the number and capacity of physical storages to be purchased can be reduced, leading to cost reduction.

ストレージシステムを説明するブロック図である。It is a block diagram explaining a storage system. ストレージ仮想化装置とストレージのシステム構成図である。1 is a system configuration diagram of a storage virtualization apparatus and a storage. ストレージ仮想化装置とストレージのシステム機能概要図であるIt is a storage virtualization apparatus and storage system function outline figure ストレージ仮想化装置の機能ブロック図である。It is a functional block diagram of a storage virtualization apparatus. ストレージ仮想化装置配下へのデータの初期登録処理のフローチャートである。It is a flowchart of the initial registration process of data under the storage virtualization apparatus. 複数の同一データが有るファイルについて、ユーザが変更を掛けた場合のストレージ仮想化装置の処理のフローチャートである。It is a flowchart of a process of the storage virtualization apparatus when a user changes a file having a plurality of identical data.

以下本発明の実施の形態について、実施例を用い図面を参照しながら詳細に説明する。なお、実質同一部位には同じ参照番号を振り、説明は繰り返さない。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings using examples. The same reference numerals are assigned to substantially the same parts, and the description will not be repeated.

まず、図2を参照して、ストレージ仮想化装置によるデータ重複除外機能を利用してリソース効率化が可能となるシステム構成を説明する。図2において、データストレージシステム500は、複数のユーザ端末100と、ネットワーク50と、データセンタ700とから構成されている。また、データセンタ700は、ネットワーク機器60−1と、ストレージ仮想化装置600と、ネットワーク機器60−2と、仮想ストレージ300と、複数のサーバ70とから構成されている。また、仮想ストレージ300は、物理ストレージ300a、300bから構成されている。   First, with reference to FIG. 2, a system configuration that enables resource efficiency using the data deduplication function of the storage virtualization apparatus will be described. In FIG. 2, the data storage system 500 includes a plurality of user terminals 100, a network 50, and a data center 700. The data center 700 includes a network device 60-1, a storage virtualization apparatus 600, a network device 60-2, a virtual storage 300, and a plurality of servers 70. The virtual storage 300 includes physical storages 300a and 300b.

ネットワーク50は、ユーザ端末100と、データセンタ700を接続する。ネットワーク機器60−1は、ユーザ端末100と、ストレージ仮想化装置600を接続する。ネットワーク機器60−2は、ストレージ仮想化装置600と、複数のサーバ70、仮想ストレージ300を接続する。   The network 50 connects the user terminal 100 and the data center 700. The network device 60-1 connects the user terminal 100 and the storage virtualization apparatus 600. The network device 60-2 connects the storage virtualization apparatus 600 to the plurality of servers 70 and the virtual storage 300.

ユーザ端末100からの通信経路は、ユーザ端末100−ストレージ仮想化装置600−仮想ストレージ300の経路をたどり通信を実施する。   The communication path from the user terminal 100 follows the path from the user terminal 100 to the storage virtualization apparatus 600 to the virtual storage 300 to perform communication.

図3を参照して、ストレージ仮想化装置のシステム機能を説明する。なお、図3は、図1と対応している。図3において、ストレージシステム500は、ストレージ仮想化装置600と、仮想ストレージ300と、複数のユーザ端末100とから構成される。仮想ストレージ300は、複数の物理ストレージ300a、300b、300c、300dから構成される。物理ストレージ300aは、ユーザ端末100−Aのファイルを保存する。物理ストレージ300bは、ユーザ端末100−Bのファイルを保存する。物理ストレージ300cは、ユーザ端末100−Cのファイルを保存する。物理ストレージ300dは、ユーザ端末100間で共通なファイルAを保存する。   The system function of the storage virtualization apparatus will be described with reference to FIG. FIG. 3 corresponds to FIG. 3, the storage system 500 includes a storage virtualization apparatus 600, a virtual storage 300, and a plurality of user terminals 100. The virtual storage 300 includes a plurality of physical storages 300a, 300b, 300c, and 300d. The physical storage 300a stores the file of the user terminal 100-A. The physical storage 300b stores the file of the user terminal 100-B. The physical storage 300c stores the file of the user terminal 100-C. The physical storage 300 d stores a file A that is common among the user terminals 100.

ユーザ端末100−Aの保存ファイルは、ファイルAとファイルBである。ユーザ端末100−Bの保存ファイルは、ファイルAとファイルCである。ユーザ端末100−Cの保存ファイルは、ファイルAとファイルDである。ただし、ファイルAは、図1との対比のため図示しているにすぎない。すなわち、ファイルAは、仮想的なファイルであって、実際の物理ストレージ300a、300b、300cに記憶されている訳ではない。   The saved files of the user terminal 100-A are file A and file B. The saved files of the user terminal 100-B are file A and file C. The saved files of the user terminal 100-C are file A and file D. However, the file A is only shown for comparison with FIG. That is, the file A is a virtual file and is not stored in the actual physical storage 300a, 300b, 300c.

ストレージ仮想化装置600は、グローバルネームスペース610と、マッピングデータ620とを備える。グローバルネームスペース610は、すべてにまたがる単一の論理的な名前空間である。グローバルネームスペース610を使うことで、ユーザや管理者は、ファイルにアクセスする際に、物理的なストレージのディレクトリ名を指定する必要がなくなる。グローバルネームスペース610は、部署名などの論理的な分類によってデータを管理する。グローバルネームスペース610は、データの物理的な位置に左右されない一貫したデータ管理を提供する。   The storage virtualization apparatus 600 includes a global namespace 610 and mapping data 620. The global namespace 610 is a single logical namespace that spans all. Using the global namespace 610 eliminates the need for a user or administrator to specify a physical storage directory name when accessing a file. The global namespace 610 manages data according to a logical classification such as a department name. Global namespace 610 provides consistent data management independent of the physical location of the data.

マッピングデータ620は、物理ストレージ300dに実際に存在するファイルと仮想化ファイルとを紐付けする。したがって、ユーザ端末100ーAのユーザは、物理ストレージ300aのファイルAを参照するとき(破線矢印)、実際にはグローバルネームスペース610、マッピングデータ620を経由して、物理ストレージ300dのファイルAを参照する(実線矢印)。なお、グローバルネームスペース610は、部署名などの論理的な分類によってデータを管理するので、ユーザ端末100ーAのユーザは、この論理的な分類にファイルAが存在すると判断するのがより正確な説明である。   The mapping data 620 associates a file that actually exists in the physical storage 300d with a virtualized file. Accordingly, when the user of the user terminal 100-A refers to the file A in the physical storage 300a (dashed arrow), the user actually refers to the file A in the physical storage 300d via the global name space 610 and the mapping data 620. (Solid arrow). Since the global name space 610 manages data according to a logical classification such as a department name, it is more accurate for the user of the user terminal 100-A to determine that the file A exists in this logical classification. It is an explanation.

本実施例によるストレージ仮想化装置600を利用したストレージシステム500Aの場合、ストレージ仮想化装置600は、配下のデータの同一性をチェックする。同一データがあれば、ストレージ仮想化装置600は、1データのみ特定のストレージエリアに移動させ、代表データとする。ストレージ仮想化装置600は、それ以外のデータを削除する。但し、ユーザ毎にディレクトリを用意する必要があるため、ストレージ仮想化装置600は、代表データと、各ユーザの仮想化エリアの仮想ファイルとマッピングさせて、参照できるようにする。   In the case of the storage system 500A using the storage virtualization apparatus 600 according to this embodiment, the storage virtualization apparatus 600 checks the identity of subordinate data. If there is the same data, the storage virtualization apparatus 600 moves only one data to a specific storage area and uses it as representative data. The storage virtualization apparatus 600 deletes other data. However, since it is necessary to prepare a directory for each user, the storage virtualization apparatus 600 maps the representative data and the virtual file in each user's virtualization area so that they can be referred to.

実際の動きは、ユーザ端末100は、ストレージ仮想化装置600を経由し、ストレージ仮想化装置600のもっているマッピング情報データ620(ファイル名とファイルサイズと更新日付とハッシュ値)と比較する。もし、同一データが複数ある場合、ストレージ仮想化装置600は、代表データを見せるようにする。同一データが無いデータ204の場合、ストレージ仮想化装置600は、そのままユーザエリアに保存されているため、実データを参照する。   The actual movement is that the user terminal 100 compares the mapping information data 620 (file name, file size, update date, and hash value) held by the storage virtualization apparatus 600 via the storage virtualization apparatus 600. If there are a plurality of identical data, the storage virtualization apparatus 600 shows representative data. In the case of data 204 that does not have the same data, the storage virtualization apparatus 600 refers to the actual data because it is stored in the user area as it is.

図4を参照して、ストレージ仮想化装置600の機能ブロックを説明する。図4において、ストレージ仮想化装置600は、パス統合制御部670と、仮想/物理紐付け制御部680と、重複情報紐付け制御部630と、仮想パス検索部640と、物理パス検索部650と、重複情報検索部660とから構成される。   The functional blocks of the storage virtualization apparatus 600 will be described with reference to FIG. 4, the storage virtualization apparatus 600 includes a path integration control unit 670, a virtual / physical association control unit 680, a duplicate information association control unit 630, a virtual path search unit 640, and a physical path search unit 650. , And a duplicate information search unit 660.

パス統合制御部670は、ユーザに見せるパス情報を制御する。仮想/物理紐付け制御部680は、実データがストレージ上に保存されている実パスと同様にストレージ上の仮想/物理マッピング情報の紐付けを行なう。重複情報紐付け制御部630は、同一情報が複数有る場合には、同一情報のうち代表データが保存されている実パスと、仮想/物理マッピング情報の紐付けを行なう。仮想パス検索部640は、ユーザ端末からユーザ情報閲覧のリクエストが来たとき、ストレージ上の仮想/物理マッピング情報エリアから閲覧したいユーザ情報の保存されている実パスと仮想パスを検索し、ユーザに仮想パスを提示する。物理パス検索部650は、ユーザが実際にデータを触ると、実データが保存されている実パスを使って実データを検索し、変更内容を反映する。重複情報検索部660は、ユーザ端末100からユーザ情報閲覧のリクエストが来たとき、もしその情報が重複情報を含むものであれば、同一情報保存エリアに保存されている代表データをユーザに閲覧させる。   The path integration control unit 670 controls path information shown to the user. The virtual / physical association control unit 680 associates virtual / physical mapping information on the storage in the same manner as the actual path where the actual data is stored on the storage. When there are a plurality of pieces of identical information, the duplicate information association control unit 630 associates a real path in which representative data is stored among the same information with the virtual / physical mapping information. When a user information browsing request is received from the user terminal, the virtual path search unit 640 searches the virtual / physical mapping information area on the storage for the real path and virtual path in which user information to be browsed is stored, and Present a virtual path. When the user actually touches the data, the physical path search unit 650 searches the actual data using the actual path where the actual data is stored, and reflects the changed contents. When a request for browsing user information is received from the user terminal 100, the duplicate information search unit 660 allows the user to browse the representative data stored in the same information storage area if the information includes duplicate information. .

ストレージ300は、仮想/物理マッピング情報を保存するエリアと通常のユーザ情報が保存されているエリアと、同一情報の代表データのみ保存されているエリアを持つ。各検索部640〜660は、必要に応じて各エリアに問合せを行なう。   The storage 300 has an area for storing virtual / physical mapping information, an area for storing normal user information, and an area for storing only representative data of the same information. Each search unit 640 to 660 inquires each area as necessary.

図5を参照して、ストレージ仮想化装置配下へのデータの初期登録処理を説明する。ストレージ仮想化装置配下へ初期登録作業は、データを外部からストレージ仮想化装置配下のストレージに持ち込むとき、および複数ストレージを統合するためストレージ仮想化装置配下に登録するときに発生する。   With reference to FIG. 5, an initial registration process of data under the storage virtualization apparatus will be described. The initial registration work under the storage virtualization apparatus occurs when data is brought into the storage under the storage virtualization apparatus from the outside, and when registration is performed under the storage virtualization apparatus in order to integrate multiple storages.

図5において、まず、ストレージ仮想化装置600は、データ移行を検知する(S302)。ストレージ仮想化装置600は、データの特徴抽出(ファイル名、データサイズ、更新日時とハッシュ値)を行なう(S303)。ストレージ仮想化装置600は、特徴抽出結果と、ストレージ仮想化装置に登録されている既存保存ファイルの特徴抽出情報と比較する(S304)。ストレージ仮想化装置600は、同一のデータがあるかを判定する(S306)。同一データが有ると判断した場合(YES)、ストレージ仮想化装置600は、移行データをコピーせず、合致するデータの代表1つを同一データ保存先に格納する(S307)。ストレージ仮想化装置600は、ユーザエリアに置くべきファイルを仮想ファイルとして登録する(S308)。ストレージ仮想化装置600は、仮想ファイル場所と代表データ場所とを紐付けるためにマッピング情報に格納する(S309)。ストレージ仮想化装置600は、移行元データを削除して(S311)、終了する。   In FIG. 5, first, the storage virtualization apparatus 600 detects data migration (S302). The storage virtualization apparatus 600 performs data feature extraction (file name, data size, update date and time, and hash value) (S303). The storage virtualization apparatus 600 compares the feature extraction result with the feature extraction information of the existing saved file registered in the storage virtualization apparatus (S304). The storage virtualization apparatus 600 determines whether there is the same data (S306). If it is determined that there is the same data (YES), the storage virtualization apparatus 600 does not copy the migration data and stores one representative of the matching data in the same data storage destination (S307). The storage virtualization apparatus 600 registers a file to be placed in the user area as a virtual file (S308). The storage virtualization apparatus 600 stores the virtual file location and the representative data location in the mapping information in order to associate the virtual file location with the representative data location (S309). The storage virtualization apparatus 600 deletes the migration source data (S311) and ends.

ステップ306で、同一のデータが無かった場合(NO)、ストレージ仮想化装置600は、ユーザエリアに新規データとして通常のコピーまたは保存して(S312)、終了する。   If there is no identical data in step 306 (NO), the storage virtualization apparatus 600 normally copies or saves it as new data in the user area (S312) and ends.

図6を参照して、ストレージ仮想化装置配下の複数の同一データが有るファイルについて、ユーザがファイルの内容変更を掛けた場合の処理を説明する。図6において、ユーザ端末からデータの変更を受け付けたとき、ストレージ仮想化装置600は、データが変更されたことを検知する(S402)。ストレージ仮想化装置600は、変更データの特徴(ファイル名、サイズ、更新日付、ハッシュ値)を抽出する(S403)。ストレージ仮想化装置600は、ストレージ上に保存された既存データの特徴と変更データの特徴を比較する(S404)。ストレージ仮想化装置600は、合致するデータがあるか判定する(S406)。YESのとき、ストレージ仮想化装置600は、合致するデータの代表1つを同一データ保存先に格納する(S407)。ストレージ仮想化装置600は、ユーザエリアに置くべきファイルを仮想ファイルとして登録する(S408)。ストレージ仮想化装置600は、仮想ファイル場所と代表データ場所を紐付けるためにマッピング情報に追加する(S409)。ストレージ仮想化装置600は、移行元データを削除し(S411)、終了する。   With reference to FIG. 6, processing when the user changes the contents of a file for a file having a plurality of identical data under the storage virtualization apparatus will be described. In FIG. 6, when the data change is received from the user terminal, the storage virtualization apparatus 600 detects that the data has been changed (S402). The storage virtualization apparatus 600 extracts the characteristics (file name, size, update date, hash value) of the changed data (S403). The storage virtualization apparatus 600 compares the characteristics of the existing data stored in the storage with the characteristics of the changed data (S404). The storage virtualization apparatus 600 determines whether there is matching data (S406). When YES, the storage virtualization apparatus 600 stores one representative of matching data in the same data storage destination (S407). The storage virtualization apparatus 600 registers a file to be placed in the user area as a virtual file (S408). The storage virtualization apparatus 600 adds the virtual file location and the representative data location to the mapping information (S409). The storage virtualization apparatus 600 deletes the migration source data (S411) and ends.

ステップ406でNOのとき、ストレージ仮想化装置600は、新規データとして、マッピング情報から代表データ場所との紐付け情報を削除する(S412)。ストレージ仮想化装置600は、新規データとしてストレージのユーザエリアに通常のコピー/移動を行なって(S413)、終了する。   When NO in step 406, the storage virtualization apparatus 600 deletes the association information with the representative data location from the mapping information as new data (S412). The storage virtualization apparatus 600 performs normal copy / move to the storage user area as new data (S413), and the process ends.

50…ネットワーク、60…ネットワーク機器、70…サーバ、100…ユーザ端末、200…ストレージ仮想化装置、210…グローバルネームスペース、300…仮想ストレージ、400…ストレージシステム、500…ストレージシステム、600…ストレージ仮想化装置、610…グローバルネームスペース、620…マッピングデータ、630…重複情報紐付け制御部、640…仮想パス検索部、650…物理パス検索部、660…重複情報検索部、670…パス統合制御部、680…仮想/物理紐付け制御部、700…データセンタ。   DESCRIPTION OF SYMBOLS 50 ... Network, 60 ... Network equipment, 70 ... Server, 100 ... User terminal, 200 ... Storage virtualization apparatus, 210 ... Global name space, 300 ... Virtual storage, 400 ... Storage system, 500 ... Storage system, 600 ... Storage virtual 610 ... Global namespace, 620 ... Mapping data, 630 ... Duplicate information linking control unit, 640 ... Virtual path search unit, 650 ... Physical path search unit, 660 ... Duplicate information search unit, 670 ... Path integration control unit 680 ... Virtual / physical association control unit 700 ... Data center.

Claims (2)

ストレージに接続され、
パス情報を制御するパス制御部と、ストレージ上の仮想/物理マッピング情報の紐付けを行なう仮想/物理紐付け制御部と、代表データが保存されている実パスと、仮想/物理マッピング情報の紐付けを行なう重複情報紐付け制御部と、ユーザ情報閲覧のリクエストが来たとき、代表データをユーザに閲覧させる重複情報検索部とからなるストレージ仮想化装置であって、
前記ストレージに移行された新規データの特徴を抽出し、既存データの特徴と比較し、合致する既存データがあるとき、前記新規データを仮想ファイルとして登録し、仮想ファイル場所と前記既存データの代表データ場所とをマッピングし、前記新規データを削除することを特徴とするストレージ仮想化装置。
Connected to storage,
A path control unit that controls path information, a virtual / physical link control unit that links virtual / physical mapping information on the storage, a real path where representative data is stored, and a link between virtual / physical mapping information A storage virtualization device comprising a duplication information linking control unit for performing pasting and a duplication information search unit for allowing a user to browse representative data when a user information browsing request is received,
The feature of the new data transferred to the storage is extracted, compared with the feature of the existing data, and when there is a matching existing data, the new data is registered as a virtual file, the virtual file location and the representative data of the existing data A storage virtualization apparatus that maps a location and deletes the new data.
請求項1に記載のストレージ仮想化装置であって、
前記新規データの特徴と前記既存データの特徴との比較において、合致する既存データがないとき、前記新規データを前記ストレージのユーザエリアに移動することを特徴とするストレージ仮想化装置。
The storage virtualization apparatus according to claim 1,
In the comparison between the characteristics of the new data and the characteristics of the existing data, when there is no matching existing data, the storage virtualization apparatus moves the new data to the user area of the storage.
JP2010145019A 2010-06-25 2010-06-25 Storage virtualization device Pending JP2012008854A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010145019A JP2012008854A (en) 2010-06-25 2010-06-25 Storage virtualization device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010145019A JP2012008854A (en) 2010-06-25 2010-06-25 Storage virtualization device

Publications (1)

Publication Number Publication Date
JP2012008854A true JP2012008854A (en) 2012-01-12

Family

ID=45539305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010145019A Pending JP2012008854A (en) 2010-06-25 2010-06-25 Storage virtualization device

Country Status (1)

Country Link
JP (1) JP2012008854A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014010023A1 (en) * 2012-07-09 2014-01-16 富士通株式会社 Extraction device, extraction program and system
JP2018022529A (en) * 2013-08-26 2018-02-08 ヴイエムウェア インコーポレイテッドVMware,Inc. Scalable distributed storage architecture
US9973575B2 (en) 2014-03-31 2018-05-15 Fujitsu Limited Distributed processing system and control method
JP2018173768A (en) * 2017-03-31 2018-11-08 日本電気株式会社 Network storage system
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US10855602B2 (en) 2013-08-26 2020-12-01 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US11016820B2 (en) 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0887386A (en) * 1994-09-16 1996-04-02 Ricoh Co Ltd Redundant storage device
US6389433B1 (en) * 1999-07-16 2002-05-14 Microsoft Corporation Method and system for automatically merging files into a single instance store
JP2004184108A (en) * 2002-11-29 2004-07-02 Xanavi Informatics Corp Data access method and data access device for in-vehicle information equipment
JP2006524873A (en) * 2003-04-24 2006-11-02 ネオパス ネットワークス,インク. Transparent file movement using namespace replication
JP2008158993A (en) * 2006-12-26 2008-07-10 Hitachi Ltd Storage system
JP2009080779A (en) * 2007-09-27 2009-04-16 Hitachi Ltd Computer system and file management method
JP2009237979A (en) * 2008-03-27 2009-10-15 Hitachi Software Eng Co Ltd Information processing device and method, and program
JP2010039966A (en) * 2008-08-08 2010-02-18 Hitachi Ltd Data management method
WO2011018852A1 (en) * 2009-08-13 2011-02-17 株式会社日立ソリューションズ Data storage device with duplicate elimination function and control device for creating search index for the data storage device
JP2012516479A (en) * 2009-05-13 2012-07-19 株式会社日立製作所 Storage system and used capacity management method in storage system

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0887386A (en) * 1994-09-16 1996-04-02 Ricoh Co Ltd Redundant storage device
US6389433B1 (en) * 1999-07-16 2002-05-14 Microsoft Corporation Method and system for automatically merging files into a single instance store
JP2004184108A (en) * 2002-11-29 2004-07-02 Xanavi Informatics Corp Data access method and data access device for in-vehicle information equipment
JP2006524873A (en) * 2003-04-24 2006-11-02 ネオパス ネットワークス,インク. Transparent file movement using namespace replication
JP2008158993A (en) * 2006-12-26 2008-07-10 Hitachi Ltd Storage system
JP2009080779A (en) * 2007-09-27 2009-04-16 Hitachi Ltd Computer system and file management method
JP2009237979A (en) * 2008-03-27 2009-10-15 Hitachi Software Eng Co Ltd Information processing device and method, and program
JP2010039966A (en) * 2008-08-08 2010-02-18 Hitachi Ltd Data management method
JP2012516479A (en) * 2009-05-13 2012-07-19 株式会社日立製作所 Storage system and used capacity management method in storage system
WO2011018852A1 (en) * 2009-08-13 2011-02-17 株式会社日立ソリューションズ Data storage device with duplicate elimination function and control device for creating search index for the data storage device

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014010023A1 (en) * 2012-07-09 2014-01-16 富士通株式会社 Extraction device, extraction program and system
US11809753B2 (en) 2013-08-26 2023-11-07 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network utilizing physical storage devices located in host computers
JP2018022529A (en) * 2013-08-26 2018-02-08 ヴイエムウェア インコーポレイテッドVMware,Inc. Scalable distributed storage architecture
US10747475B2 (en) 2013-08-26 2020-08-18 Vmware, Inc. Virtual disk blueprints for a virtualized storage area network, wherein virtual disk objects are created from local physical storage of host computers that are running multiple virtual machines
US10855602B2 (en) 2013-08-26 2020-12-01 Vmware, Inc. Distributed policy-based provisioning and enforcement for quality of service
US11016820B2 (en) 2013-08-26 2021-05-25 Vmware, Inc. Load balancing of resources
US11210035B2 (en) 2013-08-26 2021-12-28 Vmware, Inc. Creating, by host computers, respective object of virtual disk based on virtual disk blueprint
US11249956B2 (en) 2013-08-26 2022-02-15 Vmware, Inc. Scalable distributed storage architecture
US12126536B2 (en) 2013-08-26 2024-10-22 VMware LLC Distributed policy-based provisioning and enforcement for quality of service
US11704166B2 (en) 2013-08-26 2023-07-18 Vmware, Inc. Load balancing of resources
US9973575B2 (en) 2014-03-31 2018-05-15 Fujitsu Limited Distributed processing system and control method
JP2018173768A (en) * 2017-03-31 2018-11-08 日本電気株式会社 Network storage system
JP7057541B2 (en) 2017-03-31 2022-04-20 日本電気株式会社 Network storage system

Similar Documents

Publication Publication Date Title
CN102591946B (en) It is divided using index and coordinates to carry out data deduplication
US8694469B2 (en) Cloud synthetic backups
US8930364B1 (en) Intelligent data integration
US11287994B2 (en) Native key-value storage enabled distributed storage system
US20170208052A1 (en) Hybrid cloud file system and cloud based storage system having such file system therein
CN103890738B (en) System and method for preserving deduplication in storage objects after clone split operations
JP5485866B2 (en) Information management method and information providing computer
US20170208125A1 (en) Method and apparatus for data prefetch in cloud based storage system
US8909753B2 (en) Root node for file level virtualization
US20170206218A1 (en) Method and apparatus for data deduplication in cloud based storage system
CN104881466B (en) The processing of data fragmentation and the delet method of garbage files and device
JP2012008854A (en) Storage virtualization device
US20210216210A1 (en) Optimized migration of data between file systems of a storage array
CN105933376A (en) Data manipulation method, server and storage system
CN105027069A (en) Deduplication of volume regions
JP2008234570A (en) Data migration processing device
CN106484820A (en) A kind of renaming method, access method and device
CN111158851B (en) Rapid deployment method of virtual machine
CN108431815A (en) The duplicate removal complex data of distributed data in processor grid
WO2020215580A1 (en) Distributed global data deduplication method and device
EP4295235A1 (en) Cache indexing using data addresses based on data fingerprints
JP4755244B2 (en) Information generation method, information generation program, and information generation apparatus
US20250225116A1 (en) Data processing method and apparatus
JP6413792B2 (en) Storage system
JP5446378B2 (en) Storage system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120718

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20130722

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20140408