WO2019138999A1 - Display controller, storage device, storage device recovery method, and non-temporary storage medium storing recovery program for display controller - Google Patents
Display controller, storage device, storage device recovery method, and non-temporary storage medium storing recovery program for display controller Download PDFInfo
- Publication number
- WO2019138999A1 WO2019138999A1 PCT/JP2019/000206 JP2019000206W WO2019138999A1 WO 2019138999 A1 WO2019138999 A1 WO 2019138999A1 JP 2019000206 W JP2019000206 W JP 2019000206W WO 2019138999 A1 WO2019138999 A1 WO 2019138999A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- storage device
- raid
- spare
- storage
- storage devices
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/07—Responding to the occurrence of a fault, e.g. fault tolerance
- G06F11/16—Error detection or correction of the data by redundancy in hardware
- G06F11/20—Error detection or correction of the data by redundancy in hardware using active fault-masking, e.g. by switching out faulty elements or by switching in spare elements
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/06—Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
Definitions
- the present invention relates to a technology for recovering redundancy in RAID when a storage device constituting a RAID (Redundant Arrays of Inexpensive Disks) fails.
- RAID logical disk
- RAID1 logical disk
- RAID5 When a part of disks (physical disks) constituting a logical disk (RAID) having redundancy such as RAID1, RAID5, RAID6 fail, RAID is degenerated (loss of redundancy or redundancy is reduced).
- RAID logical disk
- the same data as the data held by the failed disk may be reconfigured (rebuilt), and the RAID may be restored to a non-degenerate state.
- Patent Document 1 discloses an example of a technology for reducing the time required for rebuilding.
- the storage system of Patent Document 1 includes a storage control device, a plurality of storage devices constituting one RLU (RAID Logical Unit), and a spare storage device.
- the storage control device includes a rebuild control unit and an access processing unit.
- the rebuild control unit divides the rebuilding process into partial processes, and instructs the access processing unit to execute partial processes.
- the same data as the data recorded in a storage device configuring the RLU is generated based on the data read from the remaining storage devices configuring the RLU, and is used as a spare storage device. It is a process to write.
- the partial process includes a combination of a process of reading data from a divided area obtained by dividing a data read target area by a fixed size and a process of writing data in another storage device based on the data read from the divided area.
- the access control unit executes the instructed partial processes P1 and P2 in parallel according to the execution instruction of the plurality of partial processes P1 and P2 received from the rebuild control unit.
- the storage system of Patent Document 1 speeds up the rebuilding process.
- Patent Document 2 discloses an example of a technique for starting a rebuilding process before a storage device failure is detected.
- the storage system of Patent Document 2 includes a plurality of HDDs (Hard Disk Drives), spare HDDs, and a control unit.
- the plurality of HDDs configure a RAID according to one type of RAID scheme using parity calculation.
- the spare HDD stores second data having the same content as the first data stored in any HDD among the data for which redundancy has been secured by RAID.
- the control unit spares the data stored in the replaced HDD based on the data stored in the other HDD and the spare HDD. Rebuild on the HDD.
- the storage system of Patent Document 2 stores, in the spare HDD, the second data having the same content as the first data stored in the replaced HDD. There is.
- a plurality of HDDs configure RAID according to one type of RAID method (either RAID 5 or RAID 6).
- one of a plurality of RAID methods (such as RAID 1 and RAID 5, RAID 1 and / or RAID 6) should be individually applied to each group of HDDs according to the type of data to be held, etc. There is.
- the present invention has been made in view of the above problems, and in the case where a plurality of storage devices constitute a plurality of types of RAID, the time required for restoration of redundancy in the RAID after occurrence of a failure of the storage device.
- the main purpose is to shorten the
- the disk array controller is configured to use a partial mirroring unit configured to mirror a predetermined block in each of all the storage devices configuring a plurality of types of RAID to a spare storage device, or when any of the storage devices fails.
- a storage apparatus comprises: a plurality of storage devices constituting a plurality of types of RAID; a spare storage device; and partial mirroring means for mirroring predetermined blocks in all the storage devices to the spare storage device And reconfiguring in the spare storage device a block not held by the spare storage device in the failed storage device when any of the storage devices fails, and replacing the failed storage device with the spare storage device.
- a disk array controller including reconstruction means for restoring redundancy.
- a method of recovering a storage device is a method of recovering a storage device comprising a plurality of storage devices constituting a plurality of types of RAID and a spare storage device. While mirroring a predetermined block to a spare storage device, if any of the storage devices fail, a block not retained by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failure The redundancy is restored by replacing the generated storage with spare storage.
- a recovery program of a disk array controller or a non-temporary storage medium storing the recovery program is connected to a plurality of storage devices constituting a plurality of types of RAID and a spare storage device.
- FIG. 1 is a block diagram showing an example of the configuration of a storage apparatus according to the first embodiment of this invention.
- FIG. 1 illustrates an example in which the storage device D1 and the storage device D2 configure a RAID according to the RAID1 method, and the storage device D3, the storage device D4, and the storage device D5 configure a RAID according to the RAID5 method.
- A1, A2, A3, ... indicate blocks (data in) a certain series of data
- B1, B2, B3, ... indicate blocks in another series of data To indicate).
- PB12 is a block including parity data calculated from block B1 and block B2. That is, one remaining block can be calculated from any two blocks among the block B1, the block B2, and the block PB12.
- the blocks PB34, PB56,... are similar to the block PB12.
- the RAID method in the present embodiment, the number of storage devices configuring each RAID, and the like are not limited to this example.
- the storage apparatus 100 in the present embodiment includes a plurality of storage devices 140, a spare storage device 150, and a disk array controller 110.
- the plurality of storage devices 140 configure a plurality of types of RAID.
- Each storage device 140 is, for example, an HDD, a solid state drive (SSD), or a non-volatile memory.
- the spare storage device 150 mirrors a predetermined partial block for each storage device 140.
- the spare storage device 150 is, for example, an HDD, an SSD, or a non-volatile memory.
- the disk array controller 110 controls each storage device 140 according to any of a plurality of types of RAID schemes.
- the disk array controller 110 includes a partial mirroring unit 120 and a reconfiguration unit 130.
- the plurality of types of RAID schemes are, for example, RAID 1 and RAID 5, or RAID 1 and RAID 6.
- RAID 6 when RAID 6 is used instead of RAID 5, a storage device 140 configuring RAID may be added.
- the partial mirroring unit 120 mirrors predetermined blocks in all the storage devices 140 to the spare storage device 150.
- the spare storage device 150 includes the block A1 of the storage device D1, the block A2 of the storage device D2, the block PB56 of the storage device D3, the block B8 of the storage device D4, and the block B0 of the storage device D5. It is mirrored to the spare storage device 150.
- the reconfiguration unit 130 reconfigures, in the spare storage device 150, blocks not held by the spare storage device 150 in the storage device 140 in which the failure has occurred when any of the storage devices 140 has failed. Then, the reconfiguration unit 130 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150.
- FIG. 2 is a flowchart showing the operation of the storage device in the first embodiment of the present invention.
- the storage apparatus 100 mirrors a predetermined block in each of all the storage devices 140 configuring a plurality of types of RAID in the spare storage device 150 (step S110).
- a predetermined block is selected in each of the storage devices 140 configuring a plurality of types of RAID.
- the total size of the blocks selected in each storage device 140 is preferably set so as to equalize the time required for reconfiguration of the storage device 140 in which a failure has occurred (described later in step S130).
- the storage device 100 detects whether any one of the storage devices 140 has failed (step S120).
- a failure of the storage device 140 is detected using, for example, Self-Monitoring Analysis and Reporting Technology (S.M.A.R.T.).
- step S120 No
- the storage device 100 returns the process to step S110.
- step S120 If any of the storage devices 140 fails (step S120: Yes), the storage device 100 stores the blocks not held by the spare storage device 150 in the storage device 140 in which the failure occurred in the spare storage device 150. At step S130.
- the storage device 100 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150 (step S140).
- FIG. 3 is a diagram for explaining an operation example of the storage device in the first embodiment of the present invention.
- the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D5 breaks down.
- the storage device 100 starts reconfiguration (rebuild) of the storage device D5 in the spare storage device 150.
- block B0 is already mirrored, data is rebuilt based on the data held by storage device D3 and storage device D4 for the data of PB12, B4, B6, PB78, ... in storage device D5. .
- the time required for rebuilding is reduced by the time required for rebuilding the block B0 that has been mirrored in the spare storage device 150.
- FIG. 4 is a diagram for explaining another operation example of the storage apparatus in the first embodiment of the present invention.
- the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D2 fails.
- the storage device 100 starts rebuilding of the storage device D2 in the spare storage device 150.
- the blocks A1 and A2 are already mirrored, the blocks are rebuilt based on the data held by the storage device D1 for A3, A4, A5,... In the storage device D2.
- the time required for rebuilding is reduced by the time required for rebuilding the blocks A1 and A2 that have been mirrored in the spare storage device 150.
- the storage apparatus 100 mirrors, to the spare storage apparatus 150, a predetermined partial block for each storage apparatus 140 with respect to all of the storage apparatuses 140 configuring a plurality of types of RAID. Then, when any of the storage devices 140 fails, the storage device 100 reconfigures, in the spare storage device 150, blocks not held by the spare storage device 150 in the storage device 140 in which the failure has occurred. Then, the storage device 100 restores redundancy by replacing the storage device 140 in which the failure has occurred with the spare storage device 150.
- the storage apparatus 100 when a plurality of storage devices constitute a plurality of types of RAID, it is possible to shorten the time required for the redundancy in the RAID to be restored after occurrence of a failure of the storage device. It has the effect of
- the time required from restoration of a certain storage device 140 to restoration of redundancy in RAID is equalized.
- FIG. 5 is a block diagram showing an example of a hardware configuration that can realize the storage apparatus according to each embodiment of the present invention.
- the storage device 907 includes a storage device 902, a central processing unit (CPU) 903, a keyboard 904, a monitor 905, and an input / output (I / O) device 908, which are connected by an internal bus 906. There is.
- the storage device 902 stores an operation program of the CPU 903 such as the partial mirroring unit 120 and the reconfiguration unit 130.
- the CPU 903 controls the entire storage device 907, executes an operation program stored in the storage device 902, and executes programs such as the partial mirroring unit 120 and the reconfiguration unit 130 by the I / O device 908 and transmits / receives data.
- the internal configuration of the storage device 907 described above is an example.
- the storage device 907 may have a device configuration in which a keyboard 904 and a monitor 905 are connected as necessary.
- the storage device 907 in each embodiment of the present invention described above may be realized by a dedicated device, a computer (an information processing device other than the operation of hardware in which the I / O device 908 executes communication with the outside) It can also be realized by In each embodiment of the present invention, the I / O device 908 is, for example, an input / output unit with the storage device 140, the spare storage device 150, and the like.
- the computer reads the software program stored in the storage device 902 to the CPU 903 and causes the CPU 903 to execute the read software program.
- the software program may be described so as to realize the functions of the storage device 907 or the respective units of the storage device 907 shown in FIG. 1 described above. However, it is also assumed that these parts include hardware as appropriate. And, in such a case, such software program (computer program) can be understood to constitute the present invention.
- a computer readable storage medium storing such a software program can be considered to constitute the present invention.
- the present invention can be used in applications that reduce the recovery time when a storage device constituting a RAID fails.
- Storage device 110 Disk array controller 120 Partial mirroring unit 130 Reconfiguration unit 140 Storage device 150 Spare storage device 902 Storage device 903 CPU 904 keyboard 905 monitor 906 internal bus 907 storage device 908 I / O device
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Quality & Reliability (AREA)
- Human Computer Interaction (AREA)
- Hardware Redundancy (AREA)
- Techniques For Improving Reliability Of Storages (AREA)
Abstract
Description
本発明は、RAID(Redundant Arrays of Inexpensive Disks)を構成する記憶装置の故障時にRAIDにおける冗長性を復旧する技術に関する。 The present invention relates to a technology for recovering redundancy in RAID when a storage device constituting a RAID (Redundant Arrays of Inexpensive Disks) fails.
RAID1、RAID5、RAID6等の冗長性を有する論理ディスク(RAID)を構成する一部のディスク(物理ディスク)が故障すると、RAIDが縮退(冗長性を喪失又は冗長性が低下)する。この際、予め実装されていたホットスペアディスクにおいて、故障したディスクが保持していたデータと同じデータを再構成(リビルド)し、RAIDを縮退していない状態に復旧することがある。 When a part of disks (physical disks) constituting a logical disk (RAID) having redundancy such as RAID1, RAID5, RAID6 fail, RAID is degenerated (loss of redundancy or redundancy is reduced). At this time, in the hot spare disk mounted in advance, the same data as the data held by the failed disk may be reconfigured (rebuilt), and the RAID may be restored to a non-degenerate state.
近年、ディスク容量の増大に伴い、リビルドに要する時間が増大している。そのため、RAIDが縮退状態にある時間や、リビルド中の性能低下時間の長時間化が問題になっている。 In recent years, with the increase in disk capacity, the time required for rebuilding has increased. Therefore, the time during which RAID is in a degeneracy state, and the increase in performance reduction time during rebuilding have become problems.
リビルドに要する時間を短縮する技術の一例が特許文献1に開示されている。特許文献1のストレージシステムは、ストレージ制御装置と、1つのRLU(RAID Logical Unit)を構成する複数台の記憶装置と、予備用の記憶装置とを含む。ストレージ制御装置は、リビルド制御部と、アクセス処理部とを含む。リビルド制御部は、リビルド処理を部分処理に分割して、部分処理の実行をアクセス処理部に指示する。リビルド処理は、当該RLUを構成するある記憶装置に記録されていたデータと同一のデータを、当該RLUを構成する残りの記憶装置から読み出したデータを基に生成して、予備用の記憶装置に書き込む処理である。部分処理は、データの読み出し対象範囲を一定サイズごとに分割した分割範囲からデータを読み出す処理と、この分割範囲から読み出したデータに基づいて他の記憶装置にデータを書き込む処理との組み合わせを含む。アクセス制御部は、リビルド制御部から受け付けた複数の部分処理P1、P2の実行指示に応じて、指示された部分処理P1、P2を並列に実行する。上記構成の結果、特許文献1のストレージシステムは、リビルド処理を高速化する。 Patent Document 1 discloses an example of a technology for reducing the time required for rebuilding. The storage system of Patent Document 1 includes a storage control device, a plurality of storage devices constituting one RLU (RAID Logical Unit), and a spare storage device. The storage control device includes a rebuild control unit and an access processing unit. The rebuild control unit divides the rebuilding process into partial processes, and instructs the access processing unit to execute partial processes. In the rebuild process, the same data as the data recorded in a storage device configuring the RLU is generated based on the data read from the remaining storage devices configuring the RLU, and is used as a spare storage device. It is a process to write. The partial process includes a combination of a process of reading data from a divided area obtained by dividing a data read target area by a fixed size and a process of writing data in another storage device based on the data read from the divided area. The access control unit executes the instructed partial processes P1 and P2 in parallel according to the execution instruction of the plurality of partial processes P1 and P2 received from the rebuild control unit. As a result of the above configuration, the storage system of Patent Document 1 speeds up the rebuilding process.
特許文献1の技術では、記憶装置の故障が検出された後にリビルド処理を開始する。そのため、特許文献1の技術には、リビルドの開始が遅いという問題がある。 In the technique of Patent Document 1, rebuild processing is started after a storage device failure is detected. Therefore, the technique of Patent Document 1 has a problem that the start of rebuilding is slow.
記憶装置の故障が検出される前にリビルド処理を開始する技術の一例が特許文献2に開示されている。特許文献2のストレージシステムは、複数のHDD(Hard Disk Drive)と、スペアHDDと、制御部とを備える。複数のHDDは、パリティ計算を利用する1種類のRAID方式に従って、RAIDを構成する。スペアHDDは、RAIDにより冗長性が確保されたデータのうち何れかのHDDに記憶される第1のデータと同内容の第2のデータを記憶する。制御部は、複数のHDDのうちの1つがスペアHDDに取り換えられた場合、当該取り換えられたHDDに記憶されていたデータを、他のHDD及びスペアHDDに記憶されているデータに基づいて、スペアHDDにおいてリビルドする。上記構成の結果、特許文献2のストレージシステムは、あるHDDが取り換えられた時点で、当該取り換えられたHDDに記憶される第1のデータと同内容の第2のデータをスペアHDDに記憶している。 Patent Document 2 discloses an example of a technique for starting a rebuilding process before a storage device failure is detected. The storage system of Patent Document 2 includes a plurality of HDDs (Hard Disk Drives), spare HDDs, and a control unit. The plurality of HDDs configure a RAID according to one type of RAID scheme using parity calculation. The spare HDD stores second data having the same content as the first data stored in any HDD among the data for which redundancy has been secured by RAID. When one of the plurality of HDDs is replaced with a spare HDD, the control unit spares the data stored in the replaced HDD based on the data stored in the other HDD and the spare HDD. Rebuild on the HDD. As a result of the above configuration, when a certain HDD is replaced, the storage system of Patent Document 2 stores, in the spare HDD, the second data having the same content as the first data stored in the replaced HDD. There is.
特許文献2のストレージシステムでは、複数のHDDは、1種類のRAID方式(RAID5又はRAID6の何れか)に従って、RAIDを構成している。 In the storage system of Patent Document 2, a plurality of HDDs configure RAID according to one type of RAID method (either RAID 5 or RAID 6).
一般的なストレージシステムでは、保持するデータの種類等に応じて、一群のHDDのそれぞれに、複数の種類のRAID方式(RAID1及びRAID5、RAID1及び又はRAID6等)の何れかを個別に適用することがある。 In a general storage system, one of a plurality of RAID methods (such as RAID 1 and RAID 5, RAID 1 and / or RAID 6) should be individually applied to each group of HDDs according to the type of data to be held, etc. There is.
ところが、特許文献2のストレージシステムには、複数のHDDが複数の種類のRAID方式に従ってRAIDを構成している場合に、全ての種類のRAID方式(RAID1等)における冗長性を復旧することができないという問題がある。 However, in the storage system of Patent Document 2, when a plurality of HDDs form a RAID according to a plurality of types of RAID systems, redundancy in all types of RAID systems (such as RAID 1) can not be restored. There is a problem of
本発明は、上記の課題に鑑みてなされたもので、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮することを主たる目的とする。 The present invention has been made in view of the above problems, and in the case where a plurality of storage devices constitute a plurality of types of RAID, the time required for restoration of redundancy in the RAID after occurrence of a failure of the storage device. The main purpose is to shorten the
本発明の一態様において、ディスクアレイコントローラは、複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成手段とを備える。 In one aspect of the present invention, the disk array controller is configured to use a partial mirroring unit configured to mirror a predetermined block in each of all the storage devices configuring a plurality of types of RAID to a spare storage device, or when any of the storage devices fails. And reconfiguring means for reconfiguring in the spare storage device a block not held by the spare storage device in the failed storage device and replacing the failed storage device with the spare storage device to restore redundancy. Prepare.
本発明の一態様において、ストレージ装置は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置と、全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング手段と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成手段とを含むディスクアレイコントローラとを備える。 In one aspect of the present invention, a storage apparatus comprises: a plurality of storage devices constituting a plurality of types of RAID; a spare storage device; and partial mirroring means for mirroring predetermined blocks in all the storage devices to the spare storage device And reconfiguring in the spare storage device a block not held by the spare storage device in the failed storage device when any of the storage devices fails, and replacing the failed storage device with the spare storage device. And a disk array controller including reconstruction means for restoring redundancy.
本発明の一態様において、ストレージ装置の復旧方法は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置とを備えたストレージ装置の復旧方法であって、全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングすると共に、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する。 In one aspect of the present invention, a method of recovering a storage device is a method of recovering a storage device comprising a plurality of storage devices constituting a plurality of types of RAID and a spare storage device. While mirroring a predetermined block to a spare storage device, if any of the storage devices fail, a block not retained by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failure The redundancy is restored by replacing the generated storage with spare storage.
本発明の一態様において、ディスクアレイコントローラの復旧プログラム又は、係る復旧プログラムが格納された非一時的な記憶媒体は、複数種類のRAIDを構成する複数台の記憶装置と、予備記憶装置とに接続されたディスクアレイコントローラが備えるコンピュータに、複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング処理と、記憶装置の何れかが故障した際に、故障が発生した記憶装置における予備記憶装置が保持していないブロックを予備記憶装置において再構成し、故障が発生した記憶装置を予備記憶装置に置き換えることによって冗長性を復旧する再構成処理とを実行させる。 In one aspect of the present invention, a recovery program of a disk array controller or a non-temporary storage medium storing the recovery program is connected to a plurality of storage devices constituting a plurality of types of RAID and a spare storage device. Partial mirroring processing of mirroring a predetermined block in each of all the storage devices constituting a plurality of types of RAID to a spare storage device in a computer provided in the disk array controller, and a failure in any of the storage devices. Reconfigure blocks in the spare storage device that are not held by the spare storage device in the storage device where the error occurred in the spare storage device, and execute a reconfiguration process that restores redundancy by replacing the failed storage device with the spare storage device. .
本発明によれば、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮できるという効果がある。 According to the present invention, when a plurality of storage devices constitute a plurality of types of RAID, there is an effect that it is possible to shorten the time required from the occurrence of storage device failure to recovery of redundancy in the RAID.
以下、本発明の実施形態について、図面を参照して詳細に説明する。なお、すべての図面において、同等の構成要素には同じ符号を付し、適宜説明を省略する。
(第1の実施形態)
本実施形態における構成について説明する。
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings. In all the drawings, the same components are denoted by the same reference numerals, and the description thereof will be appropriately omitted.
First Embodiment
The configuration in the present embodiment will be described.
図1は、本発明の第1の実施形態におけるストレージ装置の構成の一例を示すブロック図である。図1では、記憶装置D1及び記憶装置D2がRAID1方式によってRAIDを構成し、記憶装置D3、記憶装置D4、及び記憶装置D5がRAID5方式によってRAIDを構成する例を示している。ここで、A1、A2、A3、・・・はある一連のデータを構成するブロック(におけるデータ)を示し、B1、B2、B3、・・・は別の一連のデータを構成するブロック(におけるデータ)を示すこととする。又、PB12は、ブロックB1及びブロックB2から算出されるパリティデータを含むブロックであることとする。即ち、ブロックB1、ブロックB2、又はブロックPB12のうち何れか2つのブロックから、残りの1つのブロックを算出できる。ブロックPB34、PB56、・・・についても、ブロックPB12と同様である。又、本実施形態におけるRAID方式、各RAIDを構成する記憶装置の台数等は本例には限定されない。 FIG. 1 is a block diagram showing an example of the configuration of a storage apparatus according to the first embodiment of this invention. FIG. 1 illustrates an example in which the storage device D1 and the storage device D2 configure a RAID according to the RAID1 method, and the storage device D3, the storage device D4, and the storage device D5 configure a RAID according to the RAID5 method. Here, A1, A2, A3, ... indicate blocks (data in) a certain series of data, B1, B2, B3, ... indicate blocks in another series of data To indicate). Also, it is assumed that PB12 is a block including parity data calculated from block B1 and block B2. That is, one remaining block can be calculated from any two blocks among the block B1, the block B2, and the block PB12. The blocks PB34, PB56,... Are similar to the block PB12. Further, the RAID method in the present embodiment, the number of storage devices configuring each RAID, and the like are not limited to this example.
本実施形態におけるストレージ装置100は、複数台の記憶装置140と、予備記憶装置150と、ディスクアレイコントローラ110とを含む。
The
複数台の記憶装置140は、複数種類のRAIDを構成する。各記憶装置140は、例えば、HDD、SSD(Solid State Drive)、又は不揮発性メモリである。
The plurality of
予備記憶装置150は、記憶装置140毎に所定の一部ブロックをミラーリングする。予備記憶装置150は、例えば、HDD、SSD、又は不揮発性メモリである。
The
ディスクアレイコントローラ110は、複数種類のRAID方式の何れかに従って、各記憶装置140を制御する。ディスクアレイコントローラ110は、部分ミラーリング部120と、再構成部130とを含む。ここで、複数種類のRAID方式は、例えば、RAID1及びRAID5、又はRAID1及びRAID6である。ここで、RAID5の代わりにRAID6が使用される場合には、RAIDを構成する記憶装置140が追加されてもよい。
The
部分ミラーリング部120は、全ての記憶装置140それぞれにおける所定のブロックを予備記憶装置150にミラーリングする。図1では、予備記憶装置150は、記憶装置D1のブロックA1と、記憶装置D2のブロックA2と、記憶装置D3のブロックPB56と、記憶装置D4のブロックB8と、記憶装置D5のブロックB0とを予備記憶装置150にミラーリングしている。
The
再構成部130は、記憶装置140の何れかが故障した際に、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを、予備記憶装置150において再構成する。そして、再構成部130は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する。
The
本実施形態における動作について説明する。 The operation in this embodiment will be described.
図2は、本発明の第1の実施形態におけるストレージ装置の動作を示すフローチャートである。 FIG. 2 is a flowchart showing the operation of the storage device in the first embodiment of the present invention.
まず、ストレージ装置100は、複数種類のRAIDを構成する全ての記憶装置140それぞれにおける所定のブロックを予備記憶装置150にミラーリングする(ステップS110)。ここで、所定のブロックは、複数種類のRAIDを構成する各記憶装置140において少なくとも1つ選択されることとする。各記憶装置140において選択されたブロックの合計サイズは、故障が発生した記憶装置140の再構成(ステップS130において後述)に要する時間が均等化されるように設定されることが望ましい。
First, the
次に、ストレージ装置100は、記憶装置140の何れかが故障したか否かを検出する(ステップS120)。ここで、記憶装置140の故障は、例えば、S.M.A.R.T.(Self-Monitoring Analysis and Reporting Technology)を用いて検出される。
Next, the
記憶装置140の何れも故障しなければ(ステップS120:No)、ストレージ装置100は、ステップS110に処理を戻す。
If none of the
続いて、記憶装置140の何れかが故障すれば(ステップS120:Yes)、ストレージ装置100は、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを、予備記憶装置150において再構成する(ステップS130)。
Subsequently, if any of the
続いて、ストレージ装置100は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する(ステップS140)。
Subsequently, the
本実施形態における動作例について説明する。 An operation example in the present embodiment will be described.
図3は、本発明の第1の実施形態におけるストレージ装置の動作例を説明する図である。 FIG. 3 is a diagram for explaining an operation example of the storage device in the first embodiment of the present invention.
故障発生前において、記憶装置D1、D2、D3、D4、D5のブロックA1、A2、PB56、B8、B0はそれぞれ予備記憶装置にミラーリングされている(図1)。ある時点において、記憶装置D5が故障することとする。 Before a failure occurs, the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D5 breaks down.
このとき、ストレージ装置100は、予備記憶装置150において記憶装置D5の再構成(リビルド)を開始する。ところが、ブロックB0は既にミラーリングされているので、記憶装置D5におけるPB12、B4、B6、PB78、・・・のデータについて、記憶装置D3及び記憶装置D4によって保持されるデータに基づいてデータをリビルドする。その結果、予備記憶装置150においてミラーリング済みであったブロックB0のリビルドに要する時間の分、リビルドに要する時間が短縮される。
At this time, the
図4は、本発明の第1の実施形態におけるストレージ装置の別の動作例を説明する図である。 FIG. 4 is a diagram for explaining another operation example of the storage apparatus in the first embodiment of the present invention.
故障発生前において、記憶装置D1、D2、D3、D4、D5のブロックA1、A2、PB56、B8、B0はそれぞれ予備記憶装置にミラーリングされている(図1)。ある時点において、記憶装置D2が故障することとする。 Before a failure occurs, the blocks A1, A2, PB 56, B8, B0 of the storage devices D1, D2, D3, D4, D5 are respectively mirrored in the spare storage devices (FIG. 1). At some point in time, the storage device D2 fails.
このとき、ストレージ装置100は、予備記憶装置150において記憶装置D2のリビルドを開始する。ところが、ブロックA1、A2は既にミラーリングされているので、記憶装置D2におけるA3、A4、A5、・・・について、記憶装置D1によって保持されるデータに基づいてブロックをリビルドする。その結果、予備記憶装置150においてミラーリング済みであったブロックA1及びA2のリビルドに要する時間の分、リビルドに要する時間が短縮される。
At this time, the
以上説明したように、本実施形態におけるストレージ装置100は、複数種類のRAIDを構成する全ての記憶装置140について、記憶装置140毎の所定の一部ブロックを予備記憶装置150にミラーリングする。そして、ストレージ装置100は、記憶装置140の何れかが故障した際に、故障が発生した記憶装置140における、予備記憶装置150が保持していないブロックを予備記憶装置150において再構成する。そして、ストレージ装置100は、故障が発生した記憶装置140を予備記憶装置150に置き換えることによって冗長性を復旧する。従って、本実施形態におけるストレージ装置100には、複数の記憶装置が複数種類のRAIDを構成する場合に、記憶装置の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間を短縮できるという効果がある。
As described above, the
特に、記憶装置D1又はD2から予備記憶装置150にミラーリングされた所定のブロックの合計サイズの総和と、記憶装置D3、D4、D5、・・・それぞれから予備記憶装置150にミラーリングされた所定のブロックの合計サイズとが均等化されている場合には、ある記憶装置140の故障が発生してからRAIDにおける冗長性が復旧するまでに要する時間が均等化されるという効果がある。
In particular, the sum of the total size of the predetermined blocks mirrored from the storage device D1 or D2 to the
図5は、本発明の各実施形態におけるストレージ装置を実現可能なハードウェア構成の一例を示すブロック図である。 FIG. 5 is a block diagram showing an example of a hardware configuration that can realize the storage apparatus according to each embodiment of the present invention.
ストレージ装置907は、記憶装置902と、CPU(Central Processing Unit)903と、キーボード904と、モニタ905と、I/O(Input/Output)装置908とを備え、これらが内部バス906によって接続されている。記憶装置902は、部分ミラーリング部120、再構成部130等のCPU903の動作プログラムを格納する。CPU903は、ストレージ装置907の全体を制御し、記憶装置902に格納された動作プログラムを実行し、I/O装置908によって部分ミラーリング部120、再構成部130等のプログラムの実行やデータの送受信を行なう。尚、上記のストレージ装置907の内部構成は一例である。ストレージ装置907は、必要に応じて、キーボード904、モニタ905を接続する装置構成であってもよい。
The
上述した本発明の各実施形態におけるストレージ装置907は、専用の装置によって実現してもよいが、I/O装置908が外部との通信を実行するハードウェアの動作以外は、コンピュータ(情報処理装置)によっても実現可能である。本発明の各実施形態において、I/O装置908は、例えば、記憶装置140、予備記憶装置150等との入出力部である。この場合、係るコンピュータは、記憶装置902に格納されたソフトウェア・プログラムをCPU903に読み出し、読み出したソフトウェア・プログラムをCPU903において実行する。上述した各実施形態の場合、係るソフトウェア・プログラムには、上述したところの、図1に示した、ストレージ装置907又はストレージ装置907の各部の機能を実現可能な記述がなされていればよい。但し、これらの各部には、適宜ハードウェアを含むことも想定される。そして、このような場合、係るソフトウェア・プログラム(コンピュータ・プログラム)は、本発明を構成すると捉えることができる。更に、係るソフトウェア・プログラムを格納した、コンピュータ読み取り可能な記憶媒体も、本発明を構成すると捉えることができる。
Although the
以上、本発明を、上述した各実施形態およびその変形例によって例示的に説明した。しかしながら、本発明の技術的範囲は、上述した各実施形態およびその変形例に記載した範囲に限定されない。当業者には、係る実施形態に対して多様な変更又は改良を加えることが可能であることは明らかである。そのような場合、係る変更又は改良を加えた新たな実施形態も、本発明の技術的範囲に含まれ得る。そしてこのことは、請求の範囲に記載した事項から明らかである。 The present invention has been described above exemplarily by the above-described embodiments and the modifications thereof. However, the technical scope of the present invention is not limited to the scope described in the above-described embodiments and the modifications thereof. It will be apparent to those skilled in the art that various changes or modifications can be made to such embodiments. In such a case, new embodiments added with such changes or improvements can also be included in the technical scope of the present invention. And this is clear from the matter described in the claim.
この出願は、2018年1月10日に出願された日本出願特願2018-002031を基礎とする優先権を主張し、その開示の全てをここに取り込む。 This application claims priority based on Japanese Patent Application No. 2018-002031 filed on Jan. 10, 2018, the entire disclosure of which is incorporated herein.
本発明は、RAIDを構成する記憶装置の故障時における復旧時間を短縮する用途において利用できる。 The present invention can be used in applications that reduce the recovery time when a storage device constituting a RAID fails.
100 ストレージ装置
110 ディスクアレイコントローラ
120 部分ミラーリング部
130 再構成部
140 記憶装置
150 予備記憶装置
902 記憶装置
903 CPU
904 キーボード
905 モニタ
906 内部バス
907 ストレージ装置
908 I/O装置
100
904
Claims (7)
前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する再構成手段と
を備えたディスクアレイコントローラ。 Partial mirroring means for mirroring a predetermined block in each of all the storage devices constituting a plurality of types of RAID to a spare storage device;
When any one of the storage devices fails, a block not held by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failed storage device is replaced by the spare device. A disk array controller comprising: reconfiguration means for recovering redundancy by replacing storage devices.
請求項1に記載のディスクアレイコントローラ。 The sum of the total size of the predetermined blocks in all the storage devices constituting RAID 1 and the total size of the predetermined blocks in each of the storage devices constituting either RAID 5 or RAID 6 are equalized. The disk array controller according to 1.
前記記憶装置と、
前記予備記憶装置と、
を備えたストレージ装置。 A disk array controller according to claim 1 or 2;
The storage device;
The spare storage device;
Storage device.
予備記憶装置と
を備えたストレージ装置の復旧方法であって、
全ての前記記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングすると共に、
前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する、
ストレージ装置の復旧方法。 A plurality of storage devices constituting a plurality of types of RAID;
A method of recovering a storage device comprising a spare storage device, comprising:
Mirroring a predetermined block in each of all the storage devices to a spare storage device;
When any one of the storage devices fails, a block not held by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failed storage device is replaced by the spare device. Restore redundancy by replacing it with a storage device,
Storage device recovery method.
請求項4に記載のストレージ装置の復旧方法。 The sum of the total size of the predetermined blocks in all the storage devices constituting RAID 1 and the total size of the predetermined blocks in each of the storage devices constituting either RAID 5 or RAID 6 are equalized. The storage device recovery method according to 4.
予備記憶装置と
に接続されたディスクアレイコントローラが備えるコンピュータに、
複数種類のRAIDを構成する全ての記憶装置それぞれにおける所定のブロックを予備記憶装置にミラーリングする部分ミラーリング処理と、
前記記憶装置の何れかが故障した際に、故障が発生した前記記憶装置における前記予備記憶装置が保持していないブロックを前記予備記憶装置において再構成し、故障が発生した前記記憶装置を前記予備記憶装置に置き換えることによって冗長性を復旧する再構成処理と
を実行させる、ディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体。 A plurality of storage devices constituting a plurality of types of RAID;
A computer provided with a disk array controller connected to a spare storage device;
Partial mirroring processing for mirroring a predetermined block in each of all the storage devices constituting a plurality of types of RAID to a spare storage device;
When any one of the storage devices fails, a block not held by the spare storage device in the failed storage device is reconfigured in the spare storage device, and the failed storage device is replaced by the spare device. A non-transitory storage medium storing a recovery program of a disk array controller that executes a reconfiguration process of recovering redundancy by replacing it with a storage device.
請求項6に記載のディスクアレイコントローラの復旧プログラムを格納した非一時的な記憶媒体。 The sum of the total size of the predetermined blocks in all the storage devices constituting RAID 1 and the total size of the predetermined blocks in each of the storage devices constituting either RAID 5 or RAID 6 are equalized. A non-transitory storage medium storing the recovery program of the disk array controller according to 6.
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2018002031A JP6734305B2 (en) | 2018-01-10 | 2018-01-10 | Disk array controller, storage device, storage device recovery method, and disk array controller recovery program |
| JP2018-002031 | 2018-02-02 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2019138999A1 true WO2019138999A1 (en) | 2019-07-18 |
Family
ID=67218306
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2019/000206 Ceased WO2019138999A1 (en) | 2018-01-10 | 2019-01-08 | Display controller, storage device, storage device recovery method, and non-temporary storage medium storing recovery program for display controller |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP6734305B2 (en) |
| WO (1) | WO2019138999A1 (en) |
Families Citing this family (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| KR102697634B1 (en) * | 2022-06-07 | 2024-08-23 | 삼성전자주식회사 | Storage device and electronic system |
Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08272548A (en) * | 1995-02-10 | 1996-10-18 | Hewlett Packard Co <Hp> | Method for use of unused storage space of reserved amount |
| JP2004118837A (en) * | 2002-09-20 | 2004-04-15 | Quantum Corp | Method for storing data in fault tolerance storage sub-system, the storage sub-system and data formation management program for the system |
| JP2012185575A (en) * | 2011-03-03 | 2012-09-27 | Nec Corp | Storage system and rebuild processing quickening method |
| JP2013041394A (en) * | 2011-08-15 | 2013-02-28 | Fujitsu Ltd | Storage device and method of controlling the same |
| US20170147437A1 (en) * | 2015-11-22 | 2017-05-25 | International Business Machines Corporation | Intelligent stress testing and raid rebuild to prevent data loss |
-
2018
- 2018-01-10 JP JP2018002031A patent/JP6734305B2/en active Active
-
2019
- 2019-01-08 WO PCT/JP2019/000206 patent/WO2019138999A1/en not_active Ceased
Patent Citations (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08272548A (en) * | 1995-02-10 | 1996-10-18 | Hewlett Packard Co <Hp> | Method for use of unused storage space of reserved amount |
| JP2004118837A (en) * | 2002-09-20 | 2004-04-15 | Quantum Corp | Method for storing data in fault tolerance storage sub-system, the storage sub-system and data formation management program for the system |
| JP2012185575A (en) * | 2011-03-03 | 2012-09-27 | Nec Corp | Storage system and rebuild processing quickening method |
| JP2013041394A (en) * | 2011-08-15 | 2013-02-28 | Fujitsu Ltd | Storage device and method of controlling the same |
| US20170147437A1 (en) * | 2015-11-22 | 2017-05-25 | International Business Machines Corporation | Intelligent stress testing and raid rebuild to prevent data loss |
Also Published As
| Publication number | Publication date |
|---|---|
| JP2019121279A (en) | 2019-07-22 |
| JP6734305B2 (en) | 2020-08-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP3595099B2 (en) | Device array system | |
| JP5391993B2 (en) | Disk array device | |
| KR100275900B1 (en) | Method for implement divideo parity spare disk in raid sub-system | |
| CN101523353B (en) | Method for optimized rebuilding and copying back of a failed drive in the presence of a global hot spare | |
| US7480909B2 (en) | Method and apparatus for cooperative distributed task management in a storage subsystem with multiple controllers using cache locking | |
| US8473779B2 (en) | Systems and methods for error correction and detection, isolation, and recovery of faults in a fail-in-place storage array | |
| JP3732869B2 (en) | External storage device | |
| JP2006252126A (en) | Disk array device and method for reconstructing the same | |
| JP2006079418A (en) | Storage control device, control method, and program | |
| US20180357141A1 (en) | Data storage system comprising an array of drives | |
| US20140149787A1 (en) | Method and system for copyback completion with a failed drive | |
| JP2004348723A (en) | System and method for sparing in a RAID-1 system | |
| CN100368976C (en) | Disk array apparatus and backup method of data | |
| JP2010267037A (en) | Disk array device | |
| US20150378622A1 (en) | Management of data operations | |
| JP2005099995A (en) | Disk sharing method and system for magnetic disk device | |
| JP2013200764A (en) | Storage system, storage device and data restoration method | |
| JP3776438B2 (en) | Storage device | |
| JP6734305B2 (en) | Disk array controller, storage device, storage device recovery method, and disk array controller recovery program | |
| JP3676793B2 (en) | Disk array device | |
| JP7513294B2 (en) | STORAGE APPARATUS, STORAGE SYSTEM, FAILURE RECOVERY METHOD, AND PROGRAM | |
| JP2005107675A (en) | Disk array controller and disk drive duplication method | |
| JP2005166016A (en) | Disk array device | |
| JP3991947B2 (en) | Disk array device having two types of parity and a plurality of data recovery methods | |
| JP2014041523A (en) | Data management device, and data management method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application |
Ref document number: 19738260 Country of ref document: EP Kind code of ref document: A1 |
|
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| 122 | Ep: pct application non-entry in european phase |
Ref document number: 19738260 Country of ref document: EP Kind code of ref document: A1 |