[go: up one dir, main page]

JP2008158768A - Information storage device control method, information storage device, program, and computer-readable information recording medium - Google Patents

Information storage device control method, information storage device, program, and computer-readable information recording medium Download PDF

Info

Publication number
JP2008158768A
JP2008158768A JP2006346213A JP2006346213A JP2008158768A JP 2008158768 A JP2008158768 A JP 2008158768A JP 2006346213 A JP2006346213 A JP 2006346213A JP 2006346213 A JP2006346213 A JP 2006346213A JP 2008158768 A JP2008158768 A JP 2008158768A
Authority
JP
Japan
Prior art keywords
failure
redundancy
hard disk
information
storage device
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006346213A
Other languages
Japanese (ja)
Other versions
JP5028998B2 (en
Inventor
Hiroshi Noda
浩 野田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2006346213A priority Critical patent/JP5028998B2/en
Publication of JP2008158768A publication Critical patent/JP2008158768A/en
Application granted granted Critical
Publication of JP5028998B2 publication Critical patent/JP5028998B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

【課題】格納情報を冗長化する情報記憶装置において、冗長化状態の維持に障害が生じた際に効果的に対処され得る構成を提供することを目的とする。
【解決手段】冗長化障害記録手段が情報が冗長化された状態の維持に障害が生じた場合にその旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う構成とした。
【選択図】図4
An object of the present invention is to provide a configuration capable of effectively dealing with a failure in maintaining a redundant state in an information storage device for making stored information redundant.
When a failure occurs in maintaining a redundant state of information, the redundancy failure recording unit records the fact in the state recording unit, and the redundancy monitoring unit reports the redundancy failure from the state recording unit. And when the record of the redundancy failure is read by the redundancy monitoring means, the notification means notifies the fact.
[Selection] Figure 4

Description

本発明は情報記憶装置の制御方法、情報記憶装置、プログラム及びコンピュータ読取可能な情報記録媒体に係り、特に情報記憶装置に格納された情報を冗長化する機能を有する情報記憶装置の制御方法、その情報記憶装置、同制御方法をコンピュータに実行させるためのプログラム及び同プログラムを格納したコンピュータ読取可能な情報記録媒体に関する。   The present invention relates to an information storage device control method, an information storage device, a program, and a computer-readable information recording medium, and more particularly to an information storage device control method having a function of making information stored in an information storage device redundant, The present invention relates to an information storage device, a program for causing a computer to execute the control method, and a computer-readable information recording medium storing the program.

高信頼化を目的としてハードディスク装置を冗長化して実装する情報記憶装置において、冗長化ハードディスク装置の軽度故障、いわゆる「冗長化崩れ」が生ずることがある。   In an information storage device in which hard disk devices are redundantly mounted for the purpose of high reliability, a minor failure of the redundant hard disk device, so-called “redundancy failure” may occur.

例えば図1に示す如く、大型コンピュータを管理制御するためのSVP(サービスプロセッサ)100'と称されるコンピュータとしてユーザ運用機能、保守機能、試験機能、外部監視装置との通信機能等を提供し、これら機能の実現に必要なSVP制御プログラム20'および制御データを格納する2台のハードディスク装置HDD#0 151,HDD#1 152を実装するものとする。   For example, as shown in FIG. 1, a user operation function, a maintenance function, a test function, a communication function with an external monitoring device, etc. are provided as a computer called an SVP (service processor) 100 ′ for managing and controlling a large computer. Assume that two hard disk drives HDD # 0 151 and HDD # 1 152 for storing the SVP control program 20 ′ and control data necessary for realizing these functions are mounted.

このSVPには又、このように2台のハードディスク装置を冗長な二重化構成の資源として管理、制御するためのHDD二重化制御部31'が設けられている。   The SVP is also provided with an HDD duplication control unit 31 ′ for managing and controlling the two hard disk devices as resources of the redundant duplication configuration.

このHDD二重化制御部は2台のハードディスク装置を同一の構成で区分けし、区分けしたパーティション単位で二重化制御を行う。   The HDD duplication control unit divides two hard disk devices with the same configuration, and performs duplication control in units of divided partitions.

又HDD二重化制御部は一方のハードディスク装置(図1の例の場合、ハードディスク装置#0)に復旧不可能な故障を検出すると、故障の発生したパーティション(図1の例の場合、パーティション#1)については正常なハードディスク装置のみを用いた一重化制御に切り替えて上位のSVP制御プログラムの運用を継続する。   When the HDD duplication control unit detects a failure that cannot be recovered in one of the hard disk devices (hard disk device # 0 in the example of FIG. 1), the failed partition (partition # 1 in the example of FIG. 1). Is switched to single control using only normal hard disk devices, and the operation of the upper SVP control program is continued.

又このようにハードディスク装置の冗長化、すなわち二重化状態が一部崩れたことを上記HDD二重化制御部が保守員に通報する。   In addition, the HDD duplication control section notifies the maintenance personnel that the hard disk device has been made redundant, that is, the duplication state has partially broken.

ここで本願の明細書及び特許請求の範囲において「冗長化が崩れる」あるいは「冗長化崩れ」とは、情報が冗長化された状態、すなわち冗長化すべき情報がコピーされ同じ内容を有する情報が複数個重複して生成され、当該内容が同じ複数個の情報が複数の記録媒体のそれぞれに格納された状態、すなわち冗長化状態に対し、上記内容が同じ複数個の情報の内、全数ではない一又は複数個の情報に何らかの障害が生じることにより冗長化状態が損なわれることを意味する。   Here, in the specification and claims of the present application, “redundancy is lost” or “redundancy is lost” means that information is made redundant, that is, a plurality of pieces of information having the same contents are copied by copying the information to be made redundant. In a state where a plurality of pieces of information having the same contents are stored in each of a plurality of recording media, that is, in a redundant state, one of the plurality of pieces of information having the same contents is not the total number. Or, it means that the redundancy state is lost due to some failure in a plurality of pieces of information.

尚この「冗長化崩れ」では、上記内容が同じ複数個の情報の内少なくとも一個の情報には何ら障害が無く、もって実質的に情報の欠損は生じておらず、あくまで当該冗長化によって当初期待した情報の安全性向上の効果がその分低下するにすぎない。   In this “redundancy breakdown”, at least one piece of information having the same contents is free from any failure, so that no substantial loss of information has occurred. The effect of improving the safety of the information is only reduced accordingly.

すなわち図1の例では冗長化崩れにより二重化状態が崩れたパーティションについて、さらに正常なハードディスク装置側にも復旧不可能な故障が発生する頻度は低い。もって当該冗長化崩れの要因たる故障ハードディスク装置の交換作業に対する緊急度はあまり高くないとも言える。   That is, in the example of FIG. 1, the frequency of occurrence of an unrecoverable failure in the normal hard disk drive side is low with respect to the partition whose duplex state has been lost due to the failure of redundancy. Therefore, it can be said that the degree of urgency with respect to the replacement work of the failed hard disk drive, which is the cause of the loss of redundancy, is not so high.

しかしながらこの冗長化崩れの状態が長期間放置されることは望ましくない。さらに当該パーティションについて正常なハードディスク装置側にも故障が発生する可能性は小さいながらも存在するからである。そのような事態が生じた場合当該SPV自体の運用を停止する事態となるため、このような事態を防止するために保守員は早期に冗長化崩れからの復旧のために新たなハードディスク装置を手配して故障ハードディスク装置を交換することが望ましい。   However, it is not desirable to leave this state of failure of redundancy for a long time. Furthermore, there is a small possibility that a failure will occur on the normal hard disk device side of the partition. If such a situation occurs, the operation of the SPV itself will be stopped. Therefore, in order to prevent such a situation, the maintenance staff arranges a new hard disk device for early recovery from the breakdown of redundancy. It is desirable to replace the failed hard disk drive.

一方、当該SVPが監視制御対象とする大型コンピュータは、その装置数、部品数が多く、SVPに接続されるハードディスク装置の故障以外にも保守に必要な通報事象が多く存在し、それらの発生頻度も高い。   On the other hand, a large computer that is subject to monitoring and control by the SVP has a large number of devices and parts, and there are many notification events necessary for maintenance other than the failure of a hard disk device connected to the SVP. Is also expensive.

ここでハードディスク装置の軽度故障(すなわちパーティションの「冗長化崩れ」)が検出された場合、その旨がSVPから保守員に通報される。ここでたまたま同時にその他の優先度の高い通報事象が多く発生する場合を想定すると、それらがほぼ同時期に保守員に通報されることとなり、ハードディスク装置の軽度故障の通報が見落とされるおそれがある。
特開2004−271983号公報
Here, when a minor failure of the hard disk device (that is, the “redundancy of partition”) is detected, the SVP notifies the maintenance staff of that fact. Assuming that many other high-priority notification events happen to occur at the same time, they are reported to the maintenance staff almost at the same time, and there is a possibility that a report of a minor failure of the hard disk device may be overlooked.
JP 2004-271983 A

本発明はこのような状況に鑑みてなされたものであり、情報記憶装置においてその格納情報の冗長化を維持するのに障害が生じた場合、同障害を解消するための措置が確実になされるような構成を提供することを目的とする。   The present invention has been made in view of such a situation, and when a failure occurs in the information storage device to maintain the redundancy of the stored information, measures are taken to eliminate the failure. An object is to provide such a configuration.

本発明では冗長化手段が前記情報記憶装置に格納されている情報の冗長化を行い、情報が冗長化された状態の維持に障害が生じた場合冗長化障害記録手段が当該冗長化障害の旨を状態記録手段に記録し、冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行うようにした。   In the present invention, the redundancy means performs redundancy of the information stored in the information storage device, and when a failure occurs in maintaining the redundant state of the information, the redundancy failure recording means indicates the redundancy failure. Is recorded in the status recording means, the redundancy monitoring means reads the record indicating the redundancy failure from the status recording means, and when the redundancy monitoring means reads the record indicating the redundancy failure, the notification means The report was made.

本発明ではこのように冗長化監視手段が状態記録手段から冗長化障害の旨の記録を読み出し、冗長化監視手段により冗長化障害の旨の記録が読み出された場合通報手段がその旨の通報を行う。   In the present invention, when the redundancy monitoring means reads the record indicating the redundancy failure from the state recording means, and when the redundancy monitoring means reads the record indicating the redundancy failure, the notification means notifies the fact. I do.

このため仮に保守員が当該冗長化障害の発生の際の最初の通報に対する対応を行わず放置したような場合であっても、冗長化監視手段により状態記録手段から冗長化障害の旨の記録を読み出され、冗長化監視手段により冗長化障害の旨の記録が読み出された場合に通報手段によりその旨の通報がなされる。   For this reason, even if the maintenance staff does not respond to the first notification in the event of the occurrence of the redundancy failure, it records the redundancy failure from the status recording means by the redundancy monitoring means. When the data is read and the record of the redundancy failure is read by the redundancy monitoring means, the notification means notifies that fact.

したがって冗長化障害の状態が長期間にわたって放置されるような状況を確実に回避可能である。   Therefore, it is possible to reliably avoid a situation where the redundant failure state is left for a long period of time.

このように本発明によれば、格納情報を冗長化する機能を有する情報記憶装置において冗長化の維持に対する障害が生じた場合、当該冗長化障害の状態が長期間にわたって放置されるような状況が確実に回避可能となる。このため、情報記憶装置において格納情報の冗長化の状態が確実に維持されるようになり、もって格納情報の安全性を効果的に確保し得る。   As described above, according to the present invention, when a failure in maintaining redundancy occurs in an information storage device having a function of making stored information redundant, there is a situation in which the state of the redundancy failure is left for a long period of time. It can be avoided reliably. For this reason, the redundant state of the stored information is reliably maintained in the information storage device, so that the safety of the stored information can be effectively ensured.

以下図とともに本発明の実施例につき、詳細に説明を行う。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

本発明の実施例1について説明を行う。   Example 1 of the present invention will be described.

本発明の実施例1によれば、冗長な二重化構成のハードディスク装置を管理、制御し、一方のハードディスク装置に故障が発生しても冗長でない構成で運用が継続可能な装置において、当該故障検出時に故障を通報した後、当該故障が放置された場合には一定時間ごとに、あるいは電源投入時のたびごとに自動で当該故障の放置が再検出され、繰り返し通報がなされる。   According to the first embodiment of the present invention, in a device that manages and controls a hard disk device having a redundant redundant configuration and can continue operation with a non-redundant configuration even when a failure occurs in one of the hard disk devices, After the failure is reported, if the failure is left unattended, the failure is automatically re-detected every certain time or every time the power is turned on, and the notification is made repeatedly.

図2は本発明の実施例1による情報記録装置の制御方法を実行するコンピュータとしてのSVP(サービスプロセッサ)を含むコンピュータシステムの概要を説明するためのブロック図である。   FIG. 2 is a block diagram for explaining the outline of a computer system including an SVP (service processor) as a computer for executing the control method of the information recording apparatus according to the first embodiment of the present invention.

図2中、当該コンピュータシステムの本体装置200はシステムボード211を中心に様々な機能ユニットSSM 212,SSX0 124,SSX1 215,SSU216,IOP217,I/O219及びCLK213を有する。   In FIG. 2, the main unit 200 of the computer system has various functional units SSM 212, SSX 0 124, SSX 1 215, SSU 216, IOP 217, I / O 219, and CLK 213 centering on a system board 211.

本体装置コンソール201は、当該コンピュータシステムがユーザに提供する諸機能(システムボード211上で動作するOSにより提供される機能)をユーザが操作する為のコンソールである。   The main device console 201 is a console for the user to operate various functions provided by the computer system to the user (functions provided by the OS operating on the system board 211).

SVPコンソール101は、ユーザ運用機能、保守機能、試験機能の操作を行う為のコンソールである。ユーザモード時はユーザ運用機能のみ操作が可能となる。保守モード時は、保守に必要な機能の操作が可能となる。保守モードはユーザの運用を停止して保守を行う場合に使用する。   The SVP console 101 is a console for operating a user operation function, a maintenance function, and a test function. Only the user operation function can be operated in the user mode. In the maintenance mode, functions necessary for maintenance can be operated. The maintenance mode is used when maintenance is performed after user operation is stopped.

保守用端末202は、ユーザの運用を停止せずに保守(活性保守)を行う場合に、保守に必要な機能の操作を行う為のコンソールである。活性保守時のみ接続する。   The maintenance terminal 202 is a console for operating functions necessary for maintenance when maintenance (active maintenance) is performed without stopping user operations. Connect only during hot maintenance.

SVP100はMPU(マイクロプロセッサユニット)111,キャッシュ112,ROM121,RAM122,上記二重化構成とされたハードディスク装置151,152、MOドライブ161,フレキシブルディスクドライブ162等を有する。   The SVP 100 includes an MPU (microprocessor unit) 111, a cache 112, a ROM 121, a RAM 122, hard disk devices 151 and 152, an MO drive 161, a flexible disk drive 162, and the like configured as described above.

上記SSU216,I/O219は本体装置200の外部に接続され、SSU(System Storage Unit)216はシステム記憶装置であり、I/O(Input/Output)219はDASD等の入出力装置である。   The SSU 216 and I / O 219 are connected to the outside of the main body device 200, an SSU (System Storage Unit) 216 is a system storage device, and an I / O (Input / Output) 219 is an input / output device such as DASD.

又以下の各部は本体装置200内に接続され、SVP100による制御、保守等の対象となる。   The following units are connected to the main unit 200 and are subject to control and maintenance by the SVP 100.

システムボード211:複数のCPUとメモリとが実装される。   System board 211: A plurality of CPUs and memories are mounted.

CLK(Clock Board)213:システムボード211にクロックを分配する。   CLK (Clock Board) 213: The clock is distributed to the system board 211.

SSM(SS Mover)212:上記SSU216と接続され、主記憶とシステム記憶との間のデータ転送を行う。   SSM (SS Mover) 212: connected to the SSU 216, and performs data transfer between the main memory and the system memory.

IOP(Input/Output Processor)217:入出力装置との間のデータ転送を行う。   IOP (Input / Output Processor) 217: Transfers data to / from the input / output device.

SCI(System Console Interface)103:SVP100が本体装置200内の各部を制御、通信する為のインタフェースを提供する。   SCI (System Console Interface) 103: Provides an interface for the SVP 100 to control and communicate with each unit in the main device 200.

SPC(System Power Controller)102:本体装置200全体の電源の制御を行う。   SPC (System Power Controller) 102: Controls the power supply of the main apparatus 200 as a whole.

FAN105:冷却用ファンである。   FAN105: a cooling fan.

FEP(Front End Power Supply)106:本体装置200内の各部に電源を供給する。   FEP (Front End Power Supply) 106: supplies power to each unit in the main device 200.

又以下の各部は本体装置200内に接続されるSVP100自体と、SVP100の内部のアダプタである。   The following units are the SVP 100 itself connected to the main unit 200 and an adapter inside the SVP 100.

SVP(Service Processor)100:本体装置200のユーザ運用機能、保守機能、試験機能と、外部監視装置300との通信機能とを提供する。   SVP (Service Processor) 100: provides a user operation function, a maintenance function, a test function of the main device 200, and a communication function with the external monitoring device 300.

SCIA(SCI Adapter)144:SCI103を介して本体装置200との通信および制御を行うアダプタである。   SCIA (SCI Adapter) 144: an adapter that communicates with and controls the main apparatus 200 via the SCI 103.

SPCA(System Power controller adapter)145:SPC103とのインタフェースの制御を行うアダプタである。   SPCA (System Power controller adapter) 145: An adapter that controls an interface with the SPC 103.

DPA(Display Adapter)143:ディスプレイ装置を接続するアダプタである。   DPA (Display Adapter) 143: an adapter for connecting a display device.

SIA(Serial Interface Adapter)146:回線を接続するアダプタである。   SIA (Serial Interface Adapter) 146: an adapter for connecting lines.

FDA(Floppy Disk Adapter)141:フレキシブルディスクを制御するアダプタである。(「Floppy」は登録商標)   FDA (Floppy Disk Adapter) 141: an adapter for controlling a flexible disk. ("Floppy" is a registered trademark)

MDA(Micro Disk Adapter)130:ハードディスク装置及びMOドライブを制御するアダプタである。   MDA (Micro Disk Adapter) 130: an adapter that controls the hard disk drive and the MO drive.

SCA(SVP Communication Adapter)135:LANに接続するアダプタであり、外部監視装置300、他のSVP400との間の通信を行う。   SCA (SVP Communication Adapter) 135: an adapter connected to the LAN, and performs communication between the external monitoring apparatus 300 and another SVP 400.

図3はこのSVP100のソフトウェア構成を説明するためのブロック図である。   FIG. 3 is a block diagram for explaining the software configuration of the SVP 100.

SVP100のソフトウェアはROM121に設けられたSVP内部診断機能を提供するプログラム及び上記ハードディスク装置151,152に格納されたSVP制御プログラム20を有する。このSVP制御プログラム20はカーネル10,フレームタスク21,割り込みタスク22,初期化タスク23,エラーログタスク24及びパトロールタスク25を有する。   The software of the SVP 100 includes a program for providing an SVP internal diagnosis function provided in the ROM 121 and an SVP control program 20 stored in the hard disk devices 151 and 152. The SVP control program 20 includes a kernel 10, a frame task 21, an interrupt task 22, an initialization task 23, an error log task 24, and a patrol task 25.

初期化タスク23はハードディスク装置151,152の故障の検出を行う機能を提供し、パトロールタスク25はハードディスク装置151,152の故障の放置を検出する機能を提供する。   The initialization task 23 provides a function of detecting a failure of the hard disk devices 151 and 152, and the patrol task 25 provides a function of detecting a failure of the hard disk devices 151 and 152.

更に上記SVP制御プログラム20は、ハードディスク装置ドライバ30,フレキシブルディスクドライバ41,LANポートドライバ42,ディスプレイ装置制御ドライバ43,SCIドライバ、SPCドライバ45及びRS232Cポートドライバ46を含む。   Further, the SVP control program 20 includes a hard disk device driver 30, a flexible disk driver 41, a LAN port driver 42, a display device control driver 43, an SCI driver, an SPC driver 45, and an RS232C port driver 46.

ハーディスク装置ドライバ30はHDD二重化制御部31及びSCSI制御部32を有する。   The hard disk device driver 30 includes an HDD duplication control unit 31 and a SCSI control unit 32.

上記ROM121に設けられたプログラムはSVP100内部の診断を行う。すなわちハードディスク装置151,152のヘッダ部(パーティション#0)に書き込まれたHDD二重化制御情報を読み出し、その内容をメモリ(RAM122)上に展開する(HDD二重化制御情報31a)。又同プログラムはハードディスク装置151,152からSVP制御プログラム20のロードを行う。   The program provided in the ROM 121 performs diagnosis inside the SVP 100. That is, the HDD duplication control information written in the header part (partition # 0) of the hard disk devices 151 and 152 is read and the contents are expanded on the memory (RAM 122) (HDD duplication control information 31a). The program loads the SVP control program 20 from the hard disk devices 151 and 152.

カーネル10は又上記SVP制御プログラム20が有する各タスクの状態制御、タスク間の排他制御、通信制御を行う。更にメモリ資源、タイマ資源、ファイルの管理、制御を行う。   The kernel 10 also performs state control of each task, exclusive control between tasks, and communication control included in the SVP control program 20. It also manages and controls memory resources, timer resources, and files.

ハードディスク装置ドライバ30のHDD二重化制御部31は上記二重化制御情報31aを用いてハードディスク装置151,152の二重化、すなわち冗長化に関する制御を行う。   The HDD duplication control unit 31 of the hard disk device driver 30 controls the duplication of the hard disk devices 151 and 152, that is, redundancy, using the duplication control information 31a.

又ハードディスク装置151,152の始動、停止、情報の読み出し、書き込み等の動作は、このHDD二重化制御部31がSCSI制御部32を呼び出して実行させる。   The HDD duplication control unit 31 calls the SCSI control unit 32 to execute operations such as starting, stopping, reading of information, and writing of the hard disk devices 151 and 152.

又HDD二重化制御部31はハードディスク装置151,152の故障検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行わせる。   Also, the HDD duplication control unit 31 activates the error log task 24 via a system call when a failure of the hard disk devices 151, 152 is detected, and reports a failure.

SCSI制御部32はハードディスク装置151,152の始動、停止、動作モードの設定、ハードディスク装置151,152への情報の書き込み、同装置からの情報の読み出し、故障情報の取得等を行う。   The SCSI control unit 32 starts and stops the hard disk devices 151 and 152, sets an operation mode, writes information to the hard disk devices 151 and 152, reads information from the same device, acquires failure information, and the like.

ここでSCSI制御部32の制御対象は2台のハードディスク装置151,152とMOドライブ161である。   Here, the control targets of the SCSI control unit 32 are the two hard disk devices 151 and 152 and the MO drive 161.

フレキシブルディスクドライバ41はフロッピーディスクドライブ162(図2参照)(「フロッピー」は登録商標)の制御を行う。   The flexible disk driver 41 controls the floppy disk drive 162 (see FIG. 2) (“floppy” is a registered trademark).

LANポートドライバ42は監視装置300との通信制御を行う。   The LAN port driver 42 performs communication control with the monitoring device 300.

ディスプレイ装置制御ドライバ43は本体装置100のコンソール201及びSVP100のコンソール101との通信制御を行う。   The display device control driver 43 performs communication control with the console 201 of the main device 100 and the console 101 of the SVP 100.

RS232Cポートドライバ46は保守用端末202とRS232Cによる通信制御を行う。   The RS232C port driver 46 performs communication control between the maintenance terminal 202 and the RS232C.

SPCドライバ45はSPC102との通信制御を行う。このSPC102との通信によってコンピュータシステムの電源投入、切断時の制御がなされる。   The SPC driver 45 performs communication control with the SPC 102. Control at the time of turning on / off the computer system is performed by communication with the SPC 102.

SCIドライバ44はSCI103を経由して本体装置200の制御を行う。   The SCI driver 44 controls the main device 200 via the SCI 103.

初期化タスク23はSVP100の起動時にSVP制御プログラム20が有する各タスクの初期化、起動を行うとともにハードディスク装置151,152故障の放置のチェックを行う。そして初期化タスクハードディスク装置151,152の故障の放置を検出時、システムコール経由でエラーログタスク24を起動し、故障の通報を行う。   The initialization task 23 initializes and activates each task included in the SVP control program 20 when the SVP 100 is activated, and checks whether the hard disk devices 151 and 152 have failed. When the failure of the initialization task hard disk devices 151 and 152 is detected, the error log task 24 is activated via a system call to report the failure.

又パトロールタスク25が定期的に起動され、本体装置200の状態の監視とともにハードディスク装置151,152の故障の放置の監視を行う。ここではその監視対象によって、500ms単位、60分単位、1日単位、1週間単位で起動される。   Further, the patrol task 25 is periodically started to monitor the state of the main body device 200 and monitor the failure of the hard disk devices 151 and 152. Here, it is activated in units of 500 ms, 60 minutes, 1 day, 1 week depending on the monitoring target.

パトロールタスク25によるハードディスク装置151,152の故障の放置の監視は1週間単位で実施され、ハードディスク装置151,152の故障の放置を検出時はシステムコール経由でエラーログタスク24を起動し、故障の通報を行う。   The monitoring of the failure of the hard disk devices 151 and 152 by the patrol task 25 is performed on a weekly basis. When the failure of the hard disk devices 151 and 152 is detected, the error log task 24 is activated via a system call to detect the failure. Make a report.

エラーログタスク24は本体装置200の故障、SVP100内部の故障あるいはハードディスク装置151,152の故障が発生した場合、検出元のタスク又はドライバからシステムコール経由で起動され、エラーログの格納、コンソール、パネルへの表示、監視装置300への通報等の処理を行う。   The error log task 24 is activated via a system call from a detection source task or driver when a failure of the main body device 200, a failure of the SVP 100, or a failure of the hard disk devices 151, 152 occurs. Display, notification to the monitoring device 300, and the like.

フレームタスク21はSVPコンソール101あるいは保守用端末202経由で所定のユーザ運用機能21a及び保守機能等21bを提供する。   The frame task 21 provides a predetermined user operation function 21 a and maintenance function 21 b via the SVP console 101 or the maintenance terminal 202.

ユーザ運用機能21aとは本体装置200による制御機能に該当し、本来当該コンピュータシステムがユーザに対し提供すべき諸機能(例えば大規模通信網の通信制御機能等)を提供する機能である。   The user operation function 21a corresponds to a control function by the main body apparatus 200, and is a function that provides various functions (for example, a communication control function of a large-scale communication network) that the computer system should originally provide to the user.

保守機能21bは本体装置200及びSVP100自体の部品の保守交換機能を提供する。   The maintenance function 21b provides a maintenance / replacement function for components of the main body device 200 and the SVP 100 itself.

割り込みタスク50はSCI103経由で通知される本体装置200からの割り込みに対する処理を行う。   The interrupt task 50 performs processing for an interrupt from the main device 200 notified via the SCI 103.

図4はSVP100が有する機能の内、特に本発明に係る機能部分を抽出して示すブロック図である。   FIG. 4 is a block diagram showing an extracted function part according to the present invention, among the functions of the SVP 100.

すなわち本発明の実施例1ではHDD二重化制御部31がハードディスク装置151,152からの情報の読み出し、同装置への情報の書き込み時にハードディスク装置151,152の故障を検出し、通報する(ステップS1)。   That is, in the first embodiment of the present invention, the HDD duplication control unit 31 reads out information from the hard disk devices 151 and 152 and detects a failure of the hard disk devices 151 and 152 when writing information to the device (step S1). .

すなわちハードディスク装置151,152の軽度故障、すなわち特定のパーティション(図4に例ではパーティション#1)の二重化崩れ(冗長化崩れ)を検出した際、通信網LAN#0,LAN#1を介し監視装置300により、あるいはSVPコンソール101により保守員にその旨を通報する。   That is, when a minor failure of the hard disk devices 151 and 152, that is, a duplexing failure (redundancy failure) of a specific partition (partition # 1 in the example in FIG. 4) is detected, the monitoring device is transmitted via the communication networks LAN # 0 and LAN # 1. This is notified to the maintenance staff by 300 or by the SVP console 101.

又パトロールタスク25の機能により定期的な監視を行いハードディスク装置151,152故障の放置を検出して通報する(ステップS2)。   Further, periodic monitoring is performed by the function of the patrol task 25, and the failure of the hard disk devices 151, 152 is detected and notified (step S2).

すなわちハードディスク装置151,152に軽度故障、すなわちパーティション(パーティション#1)の二重化崩れが発生してから一定時間経過後においても当該故障が放置されている場合、これを検出して再度通信網LAN#0,LAN#1経由で監視装置300によりあるいはSVPコンソール101により保守員に「軽度故障」の旨を通報する。同様にしてさらに一定時間ごとに状態を監視し、二重化状態が回復する迄保守員への「軽度故障」の旨の通報を繰り返し行う。   That is, if the hard disk drive 151, 152 has a minor failure, that is, the failure of the partition (partition # 1) has been duplicated, the failure has been left after a certain period of time, and this is detected and the communication network LAN # 0, The maintenance device 300 is notified via the LAN # 1 or the SVP console 101 to the maintenance staff that a “minor failure” has occurred. Similarly, the status is further monitored at regular time intervals, and a notification of “minor failure” is repeatedly given to maintenance personnel until the duplex status is restored.

又初期化タスク23の機能により当該コンピュータシステムの運用開始時にハードディスク装置151,152故障の放置が検出され通報される(ステップS3)。   Also, the function of the initialization task 23 detects and reports the failure of the hard disk devices 151 and 152 when the operation of the computer system is started (step S3).

すなわちハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れを検出後、保守員によって一旦システムの運用が停止された後に再度運用が再開される場合に依然としてハードディスク装置151,152の軽度故障、すなわちパーティション#1の二重化崩れが放置されておりこれが検出された場合、再度通信網LAN#0,LAN#1経由で監視装置300あるいはSVPコンソール101により保守員に軽度故障の旨が通報される。   That is, after detecting a minor failure of the hard disk devices 151, 152, that is, the failure of duplication of the partition # 1, when the system operation is once stopped by maintenance personnel and then the operation is resumed, the minor failure of the hard disk devices 151, 152 is still That is, when the duplication of partition # 1 is left undetected and this is detected, the monitoring device 300 or the SVP console 101 notifies the maintenance staff of a minor failure via the communication networks LAN # 0 and LAN # 1 again. .

その結果ハードディスク装置151,152の軽度故障が長期間にわたって放置される事態を効果的に回避可能となり、もってハードディスク装置151,152の重複故障によるSVPの運用停止の事態を回避し高信頼な機能を提供することが可能となる。   As a result, it is possible to effectively avoid a situation in which a minor failure of the hard disk devices 151 and 152 is left for a long period of time, thereby avoiding an SVP operation stoppage due to an overlapping failure of the hard disk devices 151 and 152 and providing a highly reliable function. It becomes possible to provide.

以下に上記SVP100の機能の内、情報の冗長化機能に係る構成につき更に詳細に説明を行う。   Hereinafter, the configuration related to the information redundancy function among the functions of the SVP 100 will be described in more detail.

(1)二重化ハードディスク装置151,152の構成:
2台のハードディスク装置151,152は互いに同一の構成で区分され、各ハードディスク装置151,152の同じ位置の領域には同じデータが格納される。
(1) Configuration of the dual hard disk drives 151 and 152:
The two hard disk devices 151 and 152 are divided by the same configuration, and the same data is stored in areas at the same positions of the hard disk devices 151 and 152.

ここでこれら2台のハードディスク装置151,152の同じ位置に割り当てられる領域をパーティションと称され、当該二重化制御対象の単位とされる。   Here, an area allocated to the same position of these two hard disk devices 151 and 152 is referred to as a partition, and is a unit of the duplication control target.

各パーティションについて同一の情報がマスターハードディスク装置及びスレーブハードディスク装置により重複して保有される。すなわち各パーティションの情報が二重化あるいは冗長化状態で格納される。   The same information for each partition is redundantly held by the master hard disk device and the slave hard disk device. That is, the information of each partition is stored in a duplex or redundant state.

(2)HDD二重化制御情報31a:
2台のハードディスク装置151,152は、コンピュータシステムの本体装置200に対する実装位置に対応する識別番号が#0から順に割り振られる。以下、ハードディスク装置151,152は説明の便宜上、それぞれハードディスク装置HDD#0,HDD#1と称される場合がある。
(2) HDD duplication control information 31a:
In the two hard disk devices 151 and 152, identification numbers corresponding to mounting positions with respect to the main body device 200 of the computer system are assigned in order from # 0. Hereinafter, for convenience of explanation, the hard disk devices 151 and 152 may be referred to as hard disk devices HDD # 0 and HDD # 1, respectively.

又複数のパーティションはハードディスク装置151,152内のアドレス順に、#0から識別番号が割り振られる。   The plurality of partitions are assigned identification numbers from # 0 in the order of addresses in the hard disk devices 151 and 152.

HDD二重化制御情報31aはパーティションの番号に対応したデータテーブルにより構成される。   The HDD duplication control information 31a is composed of a data table corresponding to the partition number.

又各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び当該パーティションを重複して保有する故障ハードディスク装置の番号が示される。   Each table shows the number of the master hard disk device that holds the partition and the number of the failed hard disk device that holds the partition in duplicate.

このHDD二重化制御情報31aはパーティション#0(ハードディスク装置151,152の各々が有する記録領域のヘッダ部に対応)に格納される。   The HDD duplication control information 31a is stored in partition # 0 (corresponding to the header portion of the recording area of each of the hard disk devices 151 and 152).

HDD二重化制御情報31aはコンピュータシステムの電源投入時にハードディスク装置151,152から読み出されてメモリ122上に展開され、前回運用時のハードディスク装置151,152の二重化の構成及びその状態がそのまま引き継がれる。   The HDD duplication control information 31a is read from the hard disk devices 151 and 152 when the computer system is turned on and expanded on the memory 122, and the duplication configuration and state of the hard disk devices 151 and 152 at the previous operation are inherited as they are.

又当該コンピュータシステムの運用中にハードディスク装置151,152の状態が変化した場合、メモリ122上の情報の更新と同時に、パーティション#0に書き込まれたHDD二重化制御情報も更新される。   If the status of the hard disk devices 151 and 152 changes during the operation of the computer system, the HDD duplication control information written in the partition # 0 is updated simultaneously with the update of the information on the memory 122.

又HDD二重化制御情報31aには故障ハードディスク装置151又は152の交換時、当該故障ハードディスク装置の切り離しの際に参照される二重化有効状態が記録される。この二重化有効状態とは、ハードディスク装置151,152が二重化状態か一重化状態かを示す情報である。   In addition, the HDD duplication control information 31a records the duplication valid state that is referred to when the failed hard disk device 151 or 152 is replaced when the failed hard disk device is disconnected. The duplex valid state is information indicating whether the hard disk devices 151 and 152 are duplex or single.

尚HDD二重化制御情報については図5とともに後述する。   The HDD duplication control information will be described later with reference to FIG.

(3)HDD二重化制御部31:
HDD二重化制御部31はハードディスク装置151,152への情報の書き込みの際、該当するパーティションを重複して保有する2台のハードディスク装置151,152のそれぞれの該当する領域に同じ情報を書き込む。
(3) HDD duplication control unit 31:
When the information is written to the hard disk devices 151 and 152, the HDD duplication control unit 31 writes the same information to the corresponding areas of the two hard disk devices 151 and 152 that hold the corresponding partition in an overlapping manner.

又ハードディスク装置151,152からの情報の読み出しの際、該当するパーティションについてのマスターハードディスク装置の領域から情報を読み出す。   When information is read from the hard disk devices 151 and 152, information is read from the area of the master hard disk device for the corresponding partition.

上記書き込み処理でエラーが発生した場合エラーを生じたパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置を故障状態として認識する。   When an error occurs in the writing process, the master hard disk device or slave hard disk device for the partition in which the error has occurred is recognized as a failure state.

又読み出し処理でエラーが発生した場合、エラーを生じたパーティションについてのマスターハードディスク装置が故障状態にあるものと認識する。   If an error occurs in the read process, the master hard disk device for the partition in which the error has occurred is recognized as being in a failure state.

又読み出し又は書き込み処理で該当するパーティションについてのマスターハードディスク装置が故障した場合、当該パーティションについて故障が発生していない側のハードディスク装置、すなわちスレーブハードディスク装置を当該パーティションについてのマスターハードディスク装置として認識し直す。   When the master hard disk device for the partition concerned in the reading or writing process fails, the hard disk device on the side where the failure has not occurred, that is, the slave hard disk device is re-recognized as the master hard disk device for the partition.

(4)HDDニ重化制御部31によるハードディスク装置151,152の故障通報処理(図6〜9中、ステップS4):
HDD二重化制御部31はあるパーティションについてのマスターハードディスク装置又はスレーブハードディスク装置のいずれかが故障した場合、ハードディスク装置151,152に軽度故障、すなわちパーティションのニ重化崩れが発生したものと認識する。
(4) Failure notification processing of the hard disk devices 151 and 152 by the HDD duplex control unit 31 (steps S4 in FIGS. 6 to 9):
When either of the master hard disk device or the slave hard disk device for a certain partition fails, the HDD duplication control unit 31 recognizes that the hard disk devices 151 and 152 have a minor failure, that is, the duplication of the partition has occurred.

HDD二重化制御部31はこのようにしてハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れを検出した場合、上記の如く監視装置300あるいはSVPコンソール101を介して保守員に軽度故障の旨を通報する。   When the HDD duplication control unit 31 detects a minor failure of the hard disk devices 151 and 152 in this way, that is, the duplexing collapse of the partition, the minor maintenance failure is notified to the maintenance staff via the monitoring device 300 or the SVP console 101 as described above. Report to that effect.

(5)ハードディスク装置151,152故障の定期監視処理(図6〜9中、ステップS5):
SVP制御プログラム20のパトロールタスク25は、ハードディスク装置151,152の故障に対する定期監視処理を行う。パトロールタスク25は一週間間隔に起動され、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無を監視する。
(5) Hard disk device 151, 152 failure periodic monitoring process (step S5 in FIGS. 6-9):
The patrol task 25 of the SVP control program 20 performs regular monitoring processing for failures of the hard disk devices 151 and 152. The patrol task 25 is activated at weekly intervals to monitor whether there is a minor failure of the hard disk devices 151, 152, that is, whether the partition has been duplicated or not.

そこで故障を検出した場合、再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。   When a failure is detected, a minor failure is reported to maintenance personnel via the monitoring device 300 or the SVP console 101 again.

さらにパトロールタスク25は一週間経過するごとにハードディスク装置151,152の軽度故障の有無を監視し、ハードディスク装置151,152のニ重化状態(冗長化状態)が回復する迄保守員への軽度故障の通報を繰り返し行う。   Further, the patrol task 25 monitors the presence or absence of a minor failure of the hard disk devices 151 and 152 every week, and a minor failure to maintenance personnel until the dual state (redundancy state) of the hard disk devices 151 and 152 is restored. Repeat the report.

(6)初期化処理におけるハードディスク装置151,152の故障検出処理(図6〜9中、ステップS6):
SVP制御プログラム20の初期化タスク23は、保守員により当該コンピュータシステムの運用の停止操作がなされた後更に同システムの運用の再開操作がなされた場合、ハードディスク装置151,152の軽度故障、すなわちパーティションのニ重化崩れの有無の検出を行う。
(6) Failure detection processing of the hard disk devices 151 and 152 in the initialization processing (steps S6 in FIGS. 6 to 9):
The initialization task 23 of the SVP control program 20 is a minor failure of the hard disk devices 151 and 152 when the operation of the computer system is stopped by the maintenance staff and the operation of the system is restarted. Detect the presence or absence of double-collapse.

ハードディスク装置151,152の軽度故障を検出した場合には再度監視装置300又はSVPコンソール101を介して保守員に軽度故障の旨を通報する。   When a minor failure of the hard disk devices 151, 152 is detected, the maintenance staff is notified of the minor failure via the monitoring device 300 or the SVP console 101 again.

図5はHDD二重化制御情報31aの例を示す図である。   FIG. 5 is a diagram showing an example of the HDD duplex control information 31a.

図中「二重化有効状態」とは、以下の如く、ハードディスク装置151,152の上記二重化状態又は一重化状態を示す。

0:二重化有効状態
1:HDD#0での一重化運用状態
2:HDD#1での一重化運用状態

ハードディスク装置の活性交換時に故障ハードディスク装置を切り離す際には「HDD#0一重化運用」、又は「HDD#1一重化運用」の状態となる。すなわち何れかのハードディスク装置による単独運転となり、したがってその格納情報の二重化(冗長化)状態が無効化された状態、すなわち一重化状態となる。
In the figure, “duplexing valid state” indicates the duplexing state or the unifying state of the hard disk devices 151 and 152 as follows.

0: Duplex effective state 1: Single operation state in HDD # 0 2: Single operation state in HDD # 1

When the failed hard disk device is disconnected at the time of hot replacement of the hard disk device, the state is “HDD # 0 single operation” or “HDD # 1 single operation”. In other words, the operation is performed independently by any one of the hard disk devices, and therefore, the duplex (redundant) state of the stored information is invalidated, that is, a single state.

すなわちハードディスク装置151,152のうち、何れかに故障が生じた場合、正常状態のもののみによる運用となり、これを「一重化運用」と称している。そのような場合には故障が生じたハードディスク装置を切り離し、活性状態で新たに手配したハードディスク装置と交換する。   That is, when a failure occurs in any of the hard disk devices 151 and 152, only the normal operation is performed, which is referred to as “single operation”. In such a case, the failed hard disk device is disconnected and replaced with a newly prepared hard disk device in the active state.

図5中「復元中フラグ」とは以下の通りハードディスク装置151,152のニ重化復元作業中の状態を示す。

0:復元の為のコピー未実施状態
1:HDD#0からHDD#1へデータコピー中状態
2:HDD#1からHDD#0へデータコピー中状態

すなわち二重化が崩れた際はハードディスク装置151,152のうちの何れかが故障しているため、正常状態のもののみの運用となる。そして二重化を復元する際、運用中の正常のものから、新たに手配され交換して装着されたものへ情報のコピーを行う。
In FIG. 5, the “restoring flag” indicates a state in which the hard disk devices 151 and 152 are being duplexed and restored.

0: Copy not yet executed for restoration State 1: Data copying from HDD # 0 to HDD # 1 State 2: Data copy from HDD # 1 to HDD # 0

That is, when the duplexing is lost, one of the hard disk devices 151 and 152 is out of order, so that only the normal state is operated. When restoring the duplication, the information is copied from the normal one in operation to the one newly arranged, replaced and installed.

図5中「パーティション数」は当該ハードディスク装置151,152が有するパーティション数を示す。   In FIG. 5, “number of partitions” indicates the number of partitions that the hard disk devices 151 and 152 have.

又「パーティション#nの二重化状態」(n:0,1,2,...)とは、以下の通り当該パーティションについての二重化状態の有無を示す。

0:パーティションは二重化正常状態
1:パーティションのHDD#0側が故障状態
2:パーティションのHDD#1側が故障状態

図5中「パーティション#nのマスタHDD」(n:0,1,2,...)とは、以下の通り当該パーティションについてのマスターハードディスク装置及びスレーブハードディスク装置151,152を示す。

0:HDD#0側がマスタ:
すなわち当該パーティションの二重化状態(すなわち上記「パーティション#nの二重化状態」(n:0,1,2,...)))が「HDD#1側故障」となっていた場合等にはHDD#0側が運用ハードディスク装置でありマスタとされる。
1:HDD#1側がマスタ:
上記同様、当該パーティションの二重化状態が「HDD#0側故障」であった場合、HDD#1側が運用ハードディスク装置でありマスタとされる。

図5中「パーティション#nの物理位置」とは各パーティションの開始位置(アドレス)を示す。
The “duplex state of partition #n” (n: 0, 1, 2,...) Indicates the presence / absence of a duplex state for the partition as follows.

0: Partition is in normal duplex state 1: Partition HDD # 0 side is in failure state 2: Partition HDD # 1 side is in failure state

“Master HDD of partition #n” (n: 0, 1, 2,...) In FIG. 5 indicates the master hard disk device and slave hard disk devices 151 and 152 for the partition as follows.

0: HDD # 0 side is the master:
That is, if the duplex state of the partition (that is, the “duplex state of partition #n” (n: 0, 1, 2,...)) Is “HDD # 1 failure”, the HDD # The 0 side is the operational hard disk device and is the master.
1: HDD # 1 side is master:
Similarly to the above, when the duplication state of the partition is “HDD # 0 side failure”, the HDD # 1 side is the operation hard disk device and is set as the master.

In FIG. 5, “physical position of partition #n” indicates the start position (address) of each partition.

図6〜9はSVP100のSVP制御プログラム20の動作の流れを説明するためのフローチャートである。   6 to 9 are flowcharts for explaining the operation flow of the SVP control program 20 of the SVP 100.

ここではハードディスク装置151,152故障発生から故障ハードディスク装置の交換までの流れについて説明する。   Here, the flow from the failure occurrence of the hard disk devices 151 and 152 to the replacement of the failed hard disk device will be described.

図6〜7はハードディスク装置151,152の故障発生後2週間その故障が放置された上でコンピュータシステムの電源が切断される迄の流れを示す。   FIGS. 6 to 7 show a flow from the failure occurrence of the hard disk devices 151 and 152 until the power supply of the computer system is turned off after the failure is left for two weeks.

又図8〜9は上記コンピュータシステムの電源切断後再度電源の投入が行われ、その1週間経過後にハードディスク装置の活性交換が行われる迄の流れを示す。   FIGS. 8 to 9 show the flow from the time when the computer system is turned off to the time when the power is turned on again and the hard disk drive is replaced after one week.

この場合ハードディスク装置151,152の二重化状態では、ハードディスク装置HDD#0がマスタとされていたとする。   In this case, it is assumed that the hard disk device HDD # 0 is the master in the duplex state of the hard disk devices 151 and 152.

尚パーティション#0上の二重化制御情報についても他のパーティションのものと同様にハードディスク装置151,152の二重化制御の対象であるが、説明の便宜上単なる情報として位置づけ特に二重化制御に係る論理的な記述については省略する。   The duplication control information on partition # 0 is also subject to duplication control of the hard disk devices 151 and 152 as in the other partitions. Is omitted.

図6中、保守員がコンピュータシステムの電源を投入すると(ステップS11)、上記ROM121内のプログラムによるSVP内部診断機能によりハードディスク装置151,152のヘッダ部が読み出され(ステップS12)、読み出されたHDD二重化制御情報31aがメモリ122に展開される(ステップS13)。この処理については図10〜図13とともに後述する。   In FIG. 6, when the maintenance engineer turns on the power of the computer system (step S11), the header portions of the hard disk devices 151 and 152 are read by the SVP internal diagnosis function by the program in the ROM 121 (step S12). The HDD duplication control information 31a is expanded in the memory 122 (step S13). This process will be described later with reference to FIGS.

次に上記SPV内部診断機能により、同じくハードディスク装置151,152の内のマスターハードディスク装置HDD#0のヘッダ部からSVP制御プログラム20が読み出されメモリ122にロードされ(ステップS14)、カーネル10のブートが完了される(ステップS15)。   Next, the SPV internal diagnostic function reads the SVP control program 20 from the header portion of the master hard disk device HDD # 0 in the hard disk devices 151 and 152, and loads it into the memory 122 (step S14). Is completed (step S15).

次にカーネル10はSVP制御プログラム20の初期化タスク23を起動する(ステップS16)。初期化タスク23はハードディスク装置151,152の故障検出処理を行う。この処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。   Next, the kernel 10 starts the initialization task 23 of the SVP control program 20 (step S16). The initialization task 23 performs failure detection processing for the hard disk devices 151 and 152. This process, that is, the process of step S6 will be described later with reference to FIGS.

初期化タスク23による初期化処理が無事完了すると(ステップS17),所定のユーザ運用機能21aが実行され(ステップS18)、HDD二重化制御部31の機能によりマスターハードディスク装置HDD#0から所定の運用データファイルが読み込まれる(ステップS19)。   When the initialization process by the initialization task 23 is successfully completed (step S17), a predetermined user operation function 21a is executed (step S18), and predetermined operation data is transferred from the master hard disk device HDD # 0 by the function of the HDD duplication control unit 31. A file is read (step S19).

ここでユーザ運用機能21aを果たす目的で所定の運用データファイルをハードディスク装置151,152から読み出し中に異常が生じた場合を想定する。すなわちマスターハードディスク装置HDD#0に故障が生じ、そのパーティション#2からの読み出し時に異常が検出されたとする(ステップS20)。   Here, it is assumed that an abnormality occurs while reading a predetermined operation data file from the hard disk devices 151 and 152 for the purpose of performing the user operation function 21a. That is, it is assumed that a failure has occurred in the master hard disk device HDD # 0, and an abnormality has been detected when reading from the partition # 2 (step S20).

その場合HDD二重化制御部31は当該パーティション#2についてスレーブ側のハードディスク装置HDD#1からの読み出しを試み、これが成功したとする(ステップS21)。   In this case, the HDD duplication control unit 31 tries to read the partition # 2 from the slave-side hard disk device HDD # 1 and succeeds (step S21).

その結果を受けHDD二重化制御部31は、ハードディスク装置HDD#0のパーティション#2が故障の旨でメモリ122に展開中のHDD二重化制御情報31aを更新する(ステップS22)。又HDD二重化制御部31は同内容でハードディスク装置151,152のヘッダ部(パーティション#0)の内容を更新する(ステップS22)。   Upon receiving the result, the HDD duplexing control unit 31 updates the HDD duplexing control information 31a being expanded in the memory 122 because the partition # 2 of the hard disk device HDD # 0 has failed (step S22). The HDD duplication control unit 31 updates the contents of the header part (partition # 0) of the hard disk devices 151 and 152 with the same contents (step S22).

次にHDD二重化制御部31はカーネル10に対し、上記ハードディスク装置HDD#0の故障を「軽度故障」として通報する(ステップS24)。   Next, the HDD duplication control unit 31 notifies the kernel 10 of the failure of the hard disk device HDD # 0 as “mild failure” (step S24).

このようにして、上記ステップS20における「読み出し失敗」を除き上記運用データファイルの読み込みが正常に終了したとする(ステップS25)。   In this way, it is assumed that the operation data file has been normally read except for the “read failure” in step S20 (step S25).

そして上記ユーザ運用機能21aの実行が正常に終了したとする(ステップS26)。   Then, it is assumed that the execution of the user operation function 21a has ended normally (step S26).

次に図7中、カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して保守員に上記「軽度故障」発生の旨を通報する(ステップS27)。   Next, in FIG. 7, the kernel 10 activates the error log task 24 and notifies the maintenance personnel of the occurrence of the “minor failure” via the monitoring device 300 or the SVP console 101 (step S 27).

そして1週間経過後、カーネル10はパトロールタスク25を起動し、ハードディスク装置151,152の二重化状態チェック処理を実施させる(ステップS5)。この処理については図15〜16とともに後述する。   Then, after one week has elapsed, the kernel 10 activates the patrol task 25 to execute the duplex state check processing of the hard disk devices 151 and 152 (step S5). This process will be described later with reference to FIGS.

その結果パーティション#2についてのハードディスク装置HDD#0の故障の状態が継続していることが検出される(ステップS30)。   As a result, it is detected that the failure state of the hard disk device HDD # 0 for the partition # 2 continues (step S30).

そこでパトロールタスク25はカーネル10に対しハードディスク装置HDD#0の故障を通報する(ステップS31)。   Therefore, the patrol task 25 reports the failure of the hard disk device HDD # 0 to the kernel 10 (step S31).

これが完了すると(ステップS31)カーネル10はエラーログタスク24を起動し、監視装置300又はSVPコンソール101を介して再び保守員に「軽度故障」発生の旨を通報する(ステップS32)。   When this is completed (step S31), the kernel 10 activates the error log task 24 and notifies the maintenance personnel of the occurrence of a “minor failure” again via the monitoring device 300 or the SVP console 101 (step S32).

更に1週間後、カーネル10は再度パトロールタスク25を起動する(ステップS33)。以後ステップS34〜S37の処理は上記ステップS29〜32の処理と同様でありその説明を省略する。   After another week, the kernel 10 activates the patrol task 25 again (step S33). Thereafter, the processes of steps S34 to S37 are the same as the processes of steps S29 to S32, and the description thereof is omitted.

次に保守員がコンピュータシステムの電源停止の操作をしたとする(ステップS38)。   Next, it is assumed that the maintenance staff operates the computer system to stop power (step S38).

その結果カーネル10の制御の下、初期化タスク23を介し、HDD二重化制御部31によりハードディスク装置151,152が停止される(ステップS39〜41)。これを受け、初期化タスク23によりコンピュータシステムの電源が切断される(ステップS42)。   As a result, the hard disk drives 151 and 152 are stopped by the HDD duplication control unit 31 through the initialization task 23 under the control of the kernel 10 (steps S39 to S41). In response, the initialization task 23 turns off the computer system (step S42).

次に図8中、ステップS51にて保守員によってコンピュータシステムの電源投入操作がなされると、上記ステップS11以降の動作同様、上記ROM121のプログラムによるSVP内部診断機能によってハードディスク装置151,152のヘッダ部が読み取られる(ステップS52)。尚前記ステップS23において同ヘッダ部にはハードディスク装置HDD#0のパーティション#2の故障の旨が記録されている。   Next, in FIG. 8, when the computer system is turned on by a maintenance person in step S51, the header portions of the hard disk devices 151 and 152 are executed by the SVP internal diagnosis function based on the program in the ROM 121, as in the operations after step S11. Is read (step S52). In step S23, the fact that the partition # 2 of the hard disk device HDD # 0 has failed is recorded in the header section.

又上記ROM121のプログラムによるSVP内部診断機能はこのように読み出したHDD二重化制御情報をメモリ122に展開する(ステップS53)。そしてSVP制御プログラムをメモリ122にロードし(ステップS54)、カーネル10のブートを完了する(ステップS55)。   Further, the SVP internal diagnosis function by the program of the ROM 121 expands the HDD duplication control information read in this way in the memory 122 (step S53). Then, the SVP control program is loaded into the memory 122 (step S54), and the boot of the kernel 10 is completed (step S55).

次にカーネル10はSVP制御プログラム20の初期化タスク23を起動し(ステップS56)、初期化タスク23によりハードディスク装置151,152の故障検出処理が行われる。上記の如くこの処理、すなわち上記ステップS6の処理については図14,図16とともに後述する。   Next, the kernel 10 starts the initialization task 23 of the SVP control program 20 (step S56), and the initialization task 23 performs failure detection processing of the hard disk devices 151 and 152. As described above, this process, that is, the process of step S6 will be described later with reference to FIGS.

この場合初期化タスク23はこの処理において上記ハードディスク装置HDD#0のパーティション#2の故障を認識しエラーログタスク24を介し監視装置300又はSVPコンソール101を介して「軽度故障」の旨を保守員に通報し(ステップS57、S59)、当該初期化処理を終了する(ステップS58)。   In this case, the initialization task 23 recognizes the failure of the partition # 2 of the hard disk device HDD # 0 in this process, and the maintenance staff indicates that a “minor failure” has occurred via the monitoring device 300 or the SVP console 101 via the error log task 24. (Steps S57 and S59), and the initialization process ends (step S58).

更に1週間後カーネル10は再度パトロールタスク25を起動する(ステップS60)。以後ステップS61〜S64の処理は上記ステップS29〜32の処理と同様であり、その説明を省略する。   Furthermore, after one week, the kernel 10 activates the patrol task 25 again (step S60). Thereafter, the processing in steps S61 to S64 is the same as the processing in steps S29 to S32, and the description thereof is omitted.

ここで図9中、ステップS65にて保守員が上記故障ハードディスク装置HDD#0の活性交換を行うものとする。   Here, in FIG. 9, it is assumed that the maintenance person performs hot replacement of the failed hard disk drive HDD # 0 in step S65.

その場合SVP制御プログラム20におけるフレームタスク21の保守機能21bにより、既に上記ステップS53にてメモリ122に展開されているHDD二重化制御情報31aが参照され(ステップS66)、その結果当該活性交換の対象たる故障ハードディスク装置がハードディスク装置HDD#0で有ることが認識される。   In that case, the maintenance function 21b of the frame task 21 in the SVP control program 20 refers to the HDD duplication control information 31a already developed in the memory 122 in the above step S53 (step S66), and as a result, is subject to the hot replacement. It is recognized that the failed hard disk device is the hard disk device HDD # 0.

その結果上記保守機能21bにより故障ハードディスク装置HDD#01をSVP100から切り離す旨の指示が出され(ステップS67)、これを受けたHDD二重化制御部31により当該ハードディスク装置のモータが停止され(ステップS68)、正常な側のハードディスク装置#1のみによるいわゆる「HDD一重化運用」状態とされる。そしてこのHDD一重化運用状態とされた旨により、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS69,S70)。そしてこのようにしてHDD一重化運用状態へ移行する処理が完了した旨が上記保守機能21bに通報される(ステップS71)。   As a result, the maintenance function 21b issues an instruction to disconnect the failed hard disk device HDD # 01 from the SVP 100 (step S67), and the HDD duplication control unit 31 that receives the instruction stops the motor of the hard disk device (step S68). In other words, the hard disk device # 1 on the normal side is in a so-called “HDD unifying operation” state. Then, the HDD duplexing control information 31a developed in the memory 122 and the HDD duplexing control information in the header part of the hard disk device are respectively updated according to the HDD single operation state (steps S69 and S70). Then, the maintenance function 21b is notified that the process of shifting to the HDD single operation state has been completed (step S71).

その後保守員により故障ハードディスク装置HDD#0が正常なものと活性状態で交換されると、上記保守機能21bからHDD二重化制御装置31に対し、当該交換後のハードディスク装置HDD#0を使用した元のHDD二重化状態を復元する旨の指示が出される(ステップS75)。   Thereafter, when the failed hard disk device HDD # 0 is replaced with a normal one by the maintenance personnel, the maintenance function 21b sends the original HDD that uses the replaced hard disk device HDD # 0 to the HDD duplication control device 31. An instruction to restore the HDD duplex state is issued (step S75).

これを受けてHDD二重化制御部31はHDD二重化復元中の状態である旨で、メモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報をそれぞれ更新する(ステップS76,S77)。   In response to this, the HDD duplexing control unit 31 updates the HDD duplexing control information 31a expanded in the memory 122 and the HDD duplexing control information in the header portion of the hard disk device to indicate that the HDD duplexing recovery is in progress (step). S76, S77).

そしてステップS78にてHDD二重化制御部31は、現在運用中のハードディスク装置HDD#1から、交換された新たなハードディスク装置HDD#0に対し、その格納情報をコピーすることによって元のHDD二重化状態を復元する。   In step S78, the HDD duplication control unit 31 copies the stored information from the currently operating hard disk device HDD # 1 to the replaced new hard disk device HDD # 0, thereby changing the original HDD duplication state. Restore.

このコピー処理が全パーティションについて正常に完了すると、その旨でメモリ122に展開されたHDD二重化制御情報31a及びハードディスク装置のヘッダ部中のHDD二重化制御情報がそれぞれ更新される(ステップS79,S80)。   When this copying process is normally completed for all partitions, the HDD duplexing control information 31a expanded in the memory 122 and the HDD duplexing control information in the header part of the hard disk device are updated accordingly (steps S79 and S80).

そしてHDD二重化制御部31は保守機能21bに対しHDD二重化状態復元が完了した旨を通知する(ステップS81)。   Then, the HDD duplex control unit 31 notifies the maintenance function 21b that the HDD duplex state restoration has been completed (step S81).

そしてその1週間後カーネル10は再度パトロールタスク25を起動する(ステップS83)。   After one week, the kernel 10 activates the patrol task 25 again (step S83).

この場合、メモリに展開されているHDD二重化制御情報31aにはステップS79にて「正常状態」の旨が記録されているため、その参照の結果、パトロールタスク25はHDD二重化状態チェック処理が正常に完了した旨をカーネル10に返す(ステップS85)。   In this case, since “normal state” is recorded in step S79 in the HDD duplication control information 31a developed in the memory, as a result of the reference, the patrol task 25 performs the HDD duplication state check processing normally. The completion is returned to the kernel 10 (step S85).

このように本発明の実施例1によれば初期化タスク23及びパトロールタスク25の機能により、ハードディスク装置151,152の二重化状態が損なわれた状態が放置された場合SVP100の再起動の際及びコンピュータシステムの運用中は定期的にその状態が保守員に通報される。   As described above, according to the first embodiment of the present invention, when the state in which the duplex state of the hard disk devices 151 and 152 is lost is left by the functions of the initialization task 23 and the patrol task 25, the computer is restarted when the SVP 100 is restarted. During operation of the system, the status is regularly reported to maintenance personnel.

したがって保守員は仮に当該二重化状態が損なわれた際の最初の通報に応じた対処ができなかったような場合でも、その後上記コンピュータシステムの再起動の際、あるいは運用中の定期的な通報によりその都度注意が喚起される。   Therefore, even if maintenance personnel are unable to take action according to the initial notification when the duplexing state is impaired, the maintenance personnel will restart the computer system or perform periodic notification during operation. Attention is drawn each time.

したがって当該ハードディスク装置151,152の二重化状態が損なわれた状態が長期間にわたって放置されるような事態を効果的に回避可能である。   Therefore, it is possible to effectively avoid a situation in which a state in which the duplex state of the hard disk devices 151 and 152 is lost is left for a long period of time.

次に図10〜13とともに上記ROM121に格納されたプログラムのSVP内部診断機能による、ハードディスク装置151,152のヘッダ部からHDD二重化制御情報を読み出し、メモリ122に展開する処理の詳細を説明する。   Next, the details of the process of reading the HDD duplication control information from the header part of the hard disk devices 151 and 152 by the SVP internal diagnosis function of the program stored in the ROM 121 and developing it in the memory 122 will be described with reference to FIGS.

図10中、上記SVP内部診断機能によりハードディスク装置HDD#0のヘッダ部が読み出され(ステップS101)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS102のYes,ステップS103)。   In FIG. 10, the header portion of the hard disk device HDD # 0 is read by the SVP internal diagnosis function (step S101), and if the header portion fails to be read, a flag indicating that fact is set (step S102). Yes, step S103).

同様にハードディスク装置HDD#1のヘッダ部が読み出され(ステップS104)、同ヘッダ部の読み込みが失敗した場合にはその旨を示すフラグが設定される(ステップS105のYes,ステップS106)。   Similarly, the header part of the hard disk device HDD # 1 is read (step S104), and if the reading of the header part fails, a flag indicating that is set (Yes in step S105, step S106).

次に図11中、ステップS107において、上記フラグの設定状態の参照により、ハードディスク装置#0,#1の双方においてヘッダ部の読み込みが成功したか否かを判定する。   Next, in FIG. 11, in step S107, it is determined whether or not the header portion has been successfully read in both the hard disk devices # 0 and # 1 by referring to the flag setting state.

ハードディスク装置HDD#0,HDD#1の双方でヘッダ読み出しが失敗していた場合(ステップS108のYes),当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみでヘッダ部の読み込みが失敗していた場合(ステップS109のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS110)。
When the header reading has failed in both the hard disk devices HDD # 0 and HDD # 1 (Yes in step S108), the operation of the SVP internal diagnosis function of the program in the ROM 121 ends abnormally. In that case, the process is stopped without loading the SVP control program. (When the SPC 102 detects that the SVP has stopped using the survival check function for the SVP, the SPC displays an error code indicating that the SVP has failed to start on the panel. Stop processing.)
On the other hand, if the reading of the header portion has failed with only the hard disk device HDD # 0 (Yes in step S109), the HDD duplication control information read from the header portion of the hard disk device HDD # 1 is expanded in the memory 122 (step S110). ).

又ハードディスク装置HDD#1のみでヘッダ部の読み込みが失敗していた場合(ステップS109のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS111)。   If only the hard disk device HDD # 1 fails to read the header portion (No in step S109), the HDD duplication control information read from the header portion of the hard disk device HDD # 0 is expanded in the memory 122 (step S111). ).

又ハードディスク装置HDD#0,#1の双方でヘッダ部の読み込みが成功していた場合(ステップS107のYes),そのヘッダ部から読み込まれた情報において、ハードディスク装置HDD#0,#1の両方のパーティション#0(ヘッダ部に対応)についての故障が記録されていた場合(図12中ステップS121のYes、ステップS22のYes)、当該ROM121のプログラムのSVP内部診断機能の動作が異常終了する。その場合、SVP制御プログラムをロードせずに処理を停止する。(SPC102は、SVPに対する生存チェック機能によりSVPの停止を検出すると、パネルにSVPの起動失敗を示すエラーコードを表示する。SPCはROMプログラム121の再起動を3回まで実施し起動ができない場合は処理を停止する。)
他方ハードディスク装置HDD#0のみについてパーティション#0の故障が記録されていた場合(ステップS123のYes)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS124)。
If the reading of the header part has succeeded in both the hard disk devices HDD # 0 and # 1 (Yes in step S107), both the hard disk devices HDD # 0 and # 1 in the information read from the header part. If a failure for partition # 0 (corresponding to the header portion) has been recorded (Yes in step S121 in FIG. 12, Yes in step S22), the operation of the SVP internal diagnosis function of the program in the ROM 121 ends abnormally. In that case, the process is stopped without loading the SVP control program. (When the SPC 102 detects that the SVP has stopped using the survival check function for the SVP, the SPC displays an error code indicating that the SVP has failed to start on the panel. Stop processing.)
On the other hand, if the failure of partition # 0 is recorded only for hard disk device HDD # 0 (Yes in step S123), the HDD duplication control information read from the header portion of hard disk device HDD # 1 is expanded in memory 122 (step S123). S124).

又ハードディスク装置HDD#1のみについてパーティション#0の故障が記録されていた場合(ステップS123のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS125)。   If the failure of the partition # 0 is recorded only for the hard disk device HDD # 1 (No in step S123), the HDD duplication control information read from the header part of the hard disk device HDD # 0 is expanded in the memory 122 (step S123). S125).

又ステップS121にてハードディスク装置HDD#0,#1のいずれについてもパーティション#0の故障の記録が無かった場合、図13中ステップS126に移行する。   If there is no record of failure of partition # 0 in both hard disk devices HDD # 0 and # 1 in step S121, the process proceeds to step S126 in FIG.

ここでハードディスク装置HDD#0によるHDD一重化運用状態であった場合(ステップS126のYes,S127のYes),ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS128)。   Here, if the hard disk device HDD # 0 is in a single HDD operation state (Yes in step S126, Yes in S127), the HDD duplication control information read from the header portion of the hard disk device HDD # 0 is expanded in the memory 122. (Step S128).

他方ハードディスク装置HDD#1によるHDD一重化運用状態であった場合(ステップS126のYes,S127のNo)、ハードディスク装置HDD#1のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS129)。   On the other hand, if the hard disk device HDD # 1 is in a single HDD operation state (Yes in step S126, No in S127), the HDD duplication control information read from the header portion of the hard disk device HDD # 1 is expanded in the memory 122 ( Step S129).

他方このようなHDD一重化運用はなされておらず、すなわち通常通りHDD二重化運用がなされていた場合(ステップS126のNo)、ハードディスク装置HDD#0のヘッダ部から読み出したHDD二重化制御情報がメモリ122に展開される(ステップS130)。   On the other hand, if such HDD unification operation is not performed, that is, if the HDD duplex operation is performed as usual (No in step S126), the HDD duplex control information read from the header portion of the hard disk device HDD # 0 is stored in the memory 122. (Step S130).

このように本発明の実施例1では、図6中ステップS13あるいは図8中ステップS53においてハードディスク装置HDD#0,#1のヘッダ部からHDD二重化制御情報を読み出してメモリ122に展開する際、ハードディスク装置のヘッダ部からの読み込みが失敗した場合、読み込まれたヘッダ部の内容からヘッダ部が格納されているパーティション#0の故障が認識された場合、あるいはHDD一重化運用状態であった場合には、それぞれ、読み込みが成功した側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS108〜S111)、パーティション#0が故障していない側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開し(ステップS122〜S125)、あるいは運用中の側のハードディスク装置のヘッダ部からのHDD二重化制御情報をメモリ122に展開する(ステップS127〜S129)。   Thus, in the first embodiment of the present invention, when the HDD duplication control information is read from the header part of the hard disk drives HDD # 0 and # 1 and expanded in the memory 122 in step S13 in FIG. 6 or step S53 in FIG. When reading from the header part of the device fails, when the failure of the partition # 0 storing the header part is recognized from the contents of the read header part, or when the HDD is in a single operation mode Then, the HDD duplication control information from the header part of the hard disk device on which reading is successful is expanded in the memory 122 (steps S108 to S111), and from the header part of the hard disk device on the side where partition # 0 has not failed. The HDD duplication control information is expanded in the memory 122 (step S122). S125), or to expand the HDD duplication control information from the header portion of the side of the hard disk drive in operation into the memory 122 (step S127~S129).

その結果、より信頼性の高いHDD二重化制御情報をメモリ122に展開することが可能となる。   As a result, it is possible to develop more reliable HDD duplication control information in the memory 122.

次に図14、図15,図16とともに、初期化処理時(図6中ステップS16,S6あるいは図8中ステップS56,S6)、又は一週間ごとの定期的なHDD二重化状態チェック処理(図7中ステップS28,S5;S33,S5、図8中、ステップS60,S5,図9中ステップS83,S5)の詳細について説明する。   14, 15, and 16, the initialization process (steps S <b> 16 and S <b> 6 in FIG. 6 or steps S <b> 56 and S <b> 6 in FIG. 8) or regular HDD duplexing status check process every week (FIG. 7). The details of middle steps S28, S5; S33, S5, steps S60, S5 in FIG. 8, steps S83, S5 in FIG. 9 will be described.

まず初期化処理時カーネル10により初期化タスク23が起動され、HDD二重化状態チェック処理が実行される(図14中ステップS141)。   First, the initialization task 23 is started by the kernel 10 at the time of initialization processing, and the HDD duplex state check processing is executed (step S141 in FIG. 14).

同様に一週間ごとの定期的なHDD二重化状態チェック処理では、カーネル10によってパトロールタスク24が起動され、同じくHDD二重化状態チェック処理が実行される(図15中ステップS151)。   Similarly, in the regular HDD duplication status check process for each week, the patrol task 24 is activated by the kernel 10, and the HDD duplication status check process is also executed (step S151 in FIG. 15).

これらステップS141及びS151の各々において実行される上記HDD二重化状態チェック処理の流れを図16に示す。   FIG. 16 shows a flow of the HDD duplex status check process executed in each of these steps S141 and S151.

図16中、まずメモリ122に展開されているHDD二重化制御情報31aが参照される(ステップS161)。その際参照するハードディスク装置の番号として#0(すなわちHDD#0)が設定される(ステップS162)。   In FIG. 16, first, the HDD duplication control information 31a developed in the memory 122 is referred to (step S161). At this time, # 0 (that is, HDD # 0) is set as the number of the hard disk device to be referred to (step S162).

そして設定されたハードディスク装置HDD#0以外のハードディスク装置、すなわちハードディスク装置HDD#1でのHDD一重化運用状態であった場合(ステップS163のYes),当該ハードディスク装置HDD#0の故障の旨がカーネル10に通報される(ステップS164)。   If the hard disk device other than the set hard disk device HDD # 0, that is, the hard disk device HDD # 1, is in a single HDD operation state (Yes in step S163), the failure of the hard disk device HDD # 0 is indicated as a kernel. 10 (step S164).

他方HDD一重化運用状態ではなかった場合、すなわち通常通りHDD二重化運用であった場合(ステップS163のNo),参照すべきパーティション番号を#0に設定する(ステップS165)。そして、上記HDD二重化制御情報31a中、当該パーティションについて故障が記録されていた場合(ステップS166の「故障」)、その旨がカーネル10に通報される(ステップS167)。   On the other hand, if it is not in the HDD single operation state, that is, if it is the HDD dual operation as usual (No in step S163), the partition number to be referred to is set to # 0 (step S165). If a failure is recorded for the partition in the HDD duplication control information 31a ("failure" in step S166), the fact is notified to the kernel 10 (step S167).

そして参照すべきパーティション番号が1インクリメントされ(ステップS169)、全パーティションのチェックが完了したかが判断され(ステップS169)、全パーティションについてチェックが完了する(ステップS169の「完了」)まで、順次参照するパーティション番号がインクリメントされ(ステップS168)、各パーティションについて故障の記録の有無チェックされる(ステップS166)。故障が有ればその都度カーネル10にその旨が通報される(ステップS167)。   Then, the partition number to be referred to is incremented by 1 (step S169), it is determined whether or not all the partitions have been checked (step S169), and the check is sequentially completed until all the partitions are checked (“complete” in step S169). The partition number to be updated is incremented (step S168), and the presence or absence of failure recording is checked for each partition (step S166). When there is a failure, the fact is notified to the kernel 10 each time (step S167).

このようにして全パーティションがチェックされると(ステップS169の「完了」)、チェックすべきハードディスク装置の番号が1インクリメントされ(ステップS170)、他方のハードディスク装置、すなわちHDD#1につき上記同様のチェック及び必要に応じカーネル10への故障通報がなされる(ステップS163〜S169)。   When all partitions are checked in this way (“complete” in step S169), the number of the hard disk device to be checked is incremented by 1 (step S170), and the same check is performed for the other hard disk device, that is, HDD # 1. Further, a failure notification is made to the kernel 10 as necessary (steps S163 to S169).

次に図17〜図18とともに、図9中ステップS66以降の故障ハードディスク装置の活性交換処理の流れの詳細について説明する。   Next, with reference to FIGS. 17 to 18, the details of the flow of the active replacement process of the failed hard disk drive after step S66 in FIG. 9 will be described.

図17中ステップS181にて前記保守機能21bは、メモリ122に展開されているHDD二重化制御情報31aを参照し、その内容を保守用端末202に設けられた画面上で保守員に対し表示する(ステップS182)。   In step S181 in FIG. 17, the maintenance function 21b refers to the HDD duplication control information 31a developed in the memory 122, and displays the contents on the screen provided on the maintenance terminal 202 to the maintenance staff ( Step S182).

それに対し保守員が故障ハードディスク装置の切り離しを指示する操作を保守用端末202上で行うと(ステップS183)、HDD二重化制御部31の機能により故障ハードディスク装置がSVP100から切り離され、その完了がHDD二重化制御部を介して保守機能21bに通知される。   On the other hand, when the maintenance staff performs an operation for instructing the disconnection of the failed hard disk device on the maintenance terminal 202 (step S183), the failed hard disk device is disconnected from the SVP 100 by the function of the HDD duplication control unit 31, and the completion of the HDD duplication is completed. The maintenance function 21b is notified through the control unit.

これを受け保守機能21bは、上記の動作によりHDD一重化運用状態となった旨により、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS184)。   In response to this, the maintenance function 21b updates the HDD duplication control information on the header part and the memory of the hard disk device that is in operation, in accordance with the fact that the HDD single operation state has been achieved by the above operation (step S184).

又保守機能21bは保守用端末202の画面上で保守員に対し、故障ハードディスク装置の交換作業を促す(ステップS185)。   The maintenance function 21b prompts maintenance personnel to replace the failed hard disk device on the screen of the maintenance terminal 202 (step S185).

次に図18中、保守員が故障ハードディスク装置の交換作業を行い、交換後の新たなハードディスク装置に対する接続を指示すると、保守機能21bはHDD二重化制御部31を介して当該交換に係る新たなハードディスク装置をSVP100へ接続する動作を行い(ステップS187)、HDD二重化復元中の状態である旨で運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS188)。   Next, in FIG. 18, when the maintenance staff performs replacement work for the failed hard disk device and instructs connection to the new hard disk device after replacement, the maintenance function 21 b receives the new hard disk related to the replacement via the HDD duplication control unit 31. An operation of connecting the device to the SVP 100 is performed (step S187), and the HDD duplexing control information on the header of the hard disk device in operation and the memory are updated to indicate that the HDD duplexing restoration is in progress (step S188).

そしてHDD二重化制御部31を介し、運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作を開始する旨を保守用端末202の画面上で表示する(ステップS189)。   Then, it is maintained that the operation for restoring the original HDD duplex state is started by copying the stored information from the currently operating hard disk device to the new hard disk device to be replaced via the HDD duplex control unit 31. Is displayed on the screen of the service terminal 202 (step S189).

その後実際に運用中のハードディスク装置から前記交換に係る新たなハードディスク装置に対しその格納情報をコピーすることによって元のHDD二重化状態を復元するための動作が順次実施される(ステップS190)。その際保守用端末202の画面上では当該格納情報のコピー動作の進捗状況が表示される(ステップS191)。   Thereafter, an operation for restoring the original HDD duplex state is sequentially performed by copying the stored information from the currently operating hard disk device to the new hard disk device related to the replacement (step S190). At that time, the progress of the copy operation of the stored information is displayed on the screen of the maintenance terminal 202 (step S191).

同格納情報のコピー動作がすべてのパーティションについて終了すると保守機能21bはHDD二重化制御部31を介し、HDD二重化状態となった旨で、運用中のハードディスク装置のヘッダ部及びメモリ上のHDD二重化制御情報を更新する(ステップS192)。   When the copy operation of the stored information is completed for all the partitions, the maintenance function 21b is in the HDD duplex state via the HDD duplex control unit 31, so that the HDD duplex control information on the header part of the hard disk device in operation and the memory is in effect. Is updated (step S192).

そして保守用端末202の画面上で、故障ハードディスク装置の活性交換作業の完了の旨を表示する(ステップS193)。   Then, on the screen of the maintenance terminal 202, the fact that the active replacement work of the failed hard disk device has been completed is displayed (step S193).

ユーザの運用を停止中に保守する場合は、SVPコンソール101を保守モードにして同様な操作により故障部品の交換を行うことができる。   When maintenance is performed while the user operation is stopped, the SVP console 101 can be set in the maintenance mode, and the failed part can be replaced by a similar operation.

以下、本発明の実施例2の構成について説明する。   The configuration of the second embodiment of the present invention will be described below.

実施例2は上述の実施例1と同様の構成及び機能を有し、実施例1との相違は、冗長化するハードディスク装置が2台ではなく3台以上の場合を想定している点である。   The second embodiment has the same configuration and function as the first embodiment described above, and the difference from the first embodiment is that a case where three or more hard disk devices are made redundant is assumed instead of two. .

以下この相違点に関する内容のみ説明し、それ以外の重複する説明を省略する。   Only the contents relating to this difference will be described below, and other overlapping description will be omitted.

この場合、(1)冗長化ハードディスク装置の構成として、上記実施例1同様全ハードディスク装置は互いに同一の構成で区分され、各ハードディスク装置の同じ位置の領域には同じデータが格納される。   In this case, (1) as a configuration of the redundant hard disk device, all the hard disk devices are divided into the same configuration as in the first embodiment, and the same data is stored in the area at the same position of each hard disk device.

又上記実施例1同様全ハードディスク装置の同じ位置に割り当てられた領域をパーティションと称され、冗長化制御対象の単位とされる。   Similarly to the first embodiment, an area allocated at the same position in all hard disk devices is called a partition and is a unit for redundancy control.

各パーティションは一つのマスターハードディスク装置と、一つ以上のスレーブハードディスク装置とにより重複して保有される。   Each partition is redundantly held by one master hard disk device and one or more slave hard disk devices.

(2)上記HDD二重化制御情報31aに対応するHDD冗長化制御情報として、上記複数のハードディスク装置に対し、実装位置に対応する識別番号が#0から順に割り振られる。   (2) As HDD redundancy control information corresponding to the HDD duplication control information 31a, identification numbers corresponding to mounting positions are sequentially assigned to the plurality of hard disk devices from # 0.

又上記複数のパーティションは、ハードディスク装置内のアドレス順に#0から識別番号が割り振られる。   The plurality of partitions are assigned identification numbers from # 0 in the order of addresses in the hard disk device.

HDD冗長化制御情報はこのパーティションの番号に対応したデータテーブルにより構成される。   The HDD redundancy control information is composed of a data table corresponding to the partition number.

各テーブルには当該パーティションを保有するマスターハードディスク装置の番号及び同パーティションを保有する故障ハードディスク装置の番号が示される。ここで冗長化制御情報はパーティション#0に格納される。   Each table shows the number of the master hard disk device that owns the partition and the number of the failed hard disk device that owns the partition. Here, the redundancy control information is stored in partition # 0.

HDD冗長化制御情報はコンピュータシステムの電源投入時にハードディスク装置からSVPのメモリ上に展開され、前回運用時のHDD冗長化状態が引き継がれる。   The HDD redundancy control information is expanded from the hard disk device to the SVP memory when the computer system is turned on, and the HDD redundancy state at the previous operation is taken over.

運用中に冗長化ハードディスク装置の状態が変化した場合、上記メモリ上のHDD冗長化制御情報の更新と同時に、ハードディスク装置中のパーティション#0のHDD冗長化制御情報も同時に更新される。   When the status of the redundant hard disk device changes during operation, the HDD redundancy control information of partition # 0 in the hard disk device is updated simultaneously with the update of the HDD redundancy control information on the memory.

(3)実施例1におけるHDD二重化制御部31に対応するHDD冗長化制御部によるハードディスク装置への書き込み処理では、各パーティションを有する全ハードディスク装置の領域に同じデータが書き込まれる。   (3) In the writing process to the hard disk device by the HDD redundancy control unit corresponding to the HDD duplication control unit 31 in the first embodiment, the same data is written in the areas of all the hard disk devices having each partition.

ハードディスク装置からの読み出し処理では、パーティションを有するマスターハードディスク装置の領域からデータが読み出される。   In the read processing from the hard disk device, data is read from the area of the master hard disk device having the partition.

上記書き込み処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置又はスレーブハードディスク装置が故障状態として認識される。   When an error occurs in the writing process, the master hard disk device or slave hard disk device having the corresponding partition is recognized as a failure state.

上記読み出し処理でエラーが発生した場合、該当するパーティションを有するマスターハードディスク装置が故障状態として認識される。   When an error occurs in the reading process, the master hard disk device having the corresponding partition is recognized as a failure state.

これら読み出し又は書き込み処理で該当するパーティションを有するマスターハードディスク装置が故障した場合、当該パーティションを有する、故障の発生していない任意のハードディスク装置が当該パーティションについてのマスターハードディスク装置として割り当てられる。   When a master hard disk device having a corresponding partition fails in these read or write processes, an arbitrary hard disk device that has the partition and that has not failed is assigned as a master hard disk device for the partition.

(4)HDD冗長化制御部によるハードディスク装置故障通報処理では、各パーティションを有するマスターハードディスク装置又はスレーブハードディスク装置の内規定個数以上のものが故障した場合、冗長化ハードディスク装置に軽度故障(すなわちパーティションの冗長化崩れ)が発生したと判断される。   (4) In the hard disk device failure notification processing by the HDD redundancy control unit, if more than a prescribed number of master hard disk devices or slave hard disk devices having each partition fail, a minor failure (ie, partition It is determined that redundancy has occurred.

そしてこのハードディスク装置の軽度故障(パーティションの冗長化崩れ)が検出された場合、保守員に軽度故障の旨が通報される。   When a minor failure (disruption of partition redundancy) of the hard disk device is detected, the maintenance staff is notified of the minor failure.

(5)ハードディスク装置故障の定期監視処理機能を有するパトロールタスク(実施例1のパトロールタスク25に対応)が定期的に起動され、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の有無が監視される。   (5) A patrol task (corresponding to the patrol task 25 of the first embodiment) having a function for periodically monitoring hard disk device failure is periodically started to monitor the presence or absence of a minor failure (partition redundancy failure) of the hard disk device. The

同処理において軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。そしてさらに、一定時間経過するごとに、ハードディスク装置の軽度故障の有無がチェックされ、元のハードディスク装置の冗長化状態が回復する迄、保守員への軽度故障の旨の通報が繰り返しなされる。   If a minor failure is detected in this process, the maintenance staff is notified again of the minor failure. Further, every time a certain period of time elapses, the presence or absence of a minor failure of the hard disk device is checked, and until the redundancy state of the original hard disk device is restored, a notification to the maintenance staff that the minor failure has occurred is repeated.

(6)初期化処理によるハードディスク装置故障検出処理では、保守員によりSVPの運用停止後に運用の再開があった場合、ハードディスク装置の軽度故障(パーティションの冗長化崩れ)の検出がなされる。   (6) In the hard disk device failure detection processing by the initialization processing, when the maintenance staff resumes the operation after stopping the operation of the SVP, a minor failure of the hard disk device (partition redundancy failure) is detected.

同処理においてハードディスク装置の軽度故障が検出された場合、再度保守員に軽度故障の旨が通報される。   If a minor failure of the hard disk device is detected in this process, the maintenance staff is notified again of the minor failure.

このように本発明の実施例2によれば、複数個のハードディスク装置による格納情報の冗長化を行う場合、すなわち複数個のハードディスク装置に同じ内容の情報をそれぞれ重複して格納することによりその内の一又は複数個(上記冗長化に係るハードディスク装置の全個数より少ない個数)のハードディスク装置の格納情報が損なわれても残りのハードディスク装置に同じ内容の情報が格納されているため格納情報の安全化が図られる場合、当該冗長化に係るハードディスク装置の全個数より少ない一以上の所定の個数のハードディスク装置の格納情報が損なわれたと判断された場合にはその旨が保守員に自動的に通報され、又その通報はSVPの起動のたびごとに、さらには運用中は一定期間ごとに行われる。   As described above, according to the second embodiment of the present invention, when storing information is made redundant by a plurality of hard disk devices, that is, by storing information of the same contents in a plurality of hard disk devices, respectively, Even if the stored information of one or more hard disk devices (less than the total number of hard disk devices related to redundancy) is damaged, the same information is stored in the remaining hard disk devices, so the stored information is safe. If it is determined that the information stored in one or more predetermined number of hard disk devices, which is less than the total number of hard disk devices related to the redundancy, is damaged, the maintenance personnel are automatically notified of this. In addition, the notification is made every time the SVP is activated, and further every fixed period during operation.

その結果、仮に最初の軽度故障の通報の際に保守員が故障ハードディスク装置の交換等による対応を行わなかったような場合であっても、SVPの起動のたびごと、さらには運用中は一定期間ごとに同様の通報が自動的に保守員に対してなされるため、冗長化状態が損なわれた状態、いわゆる冗長化崩れの状態が長期間にわたって放置されるような事態が効果的に回避され得る。   As a result, even if the maintenance staff did not respond by replacing the failed hard disk device at the time of the first minor failure notification, every time the SVP is started up, and even during operation, a certain period of time Since the same notification is automatically sent to the maintenance staff every time, the situation where the redundancy state is impaired, that is, the state where the so-called redundancy failure state is left for a long period of time can be effectively avoided. .

本発明は以下の付記の各々に記載の構成をとり得る。
(付記1)
情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
(付記2)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記1に記載の情報記憶装置の制御方法。
(付記3)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記4)
前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の付記1に記載の情報記憶装置の制御方法。
(付記5)
情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
(付記6)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記5に記載の情報記憶装置。
(付記7)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記8)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記5に記載の情報記憶装置。
(付記9)
情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
(付記10)
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる付記9に記載のプログラム。
(付記11)
前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記12)
前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の付記9に記載のプログラム。
(付記13)
付記9〜12のうちの何れか一項に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。
The present invention can take the configurations described in the following supplementary notes.
(Appendix 1)
An information storage device control method comprising:
The information stored in the information storage device is made redundant,
When a failure occurs in maintaining the redundant state of the information, the redundant failure recording unit records the redundancy failure in the state recording unit,
The redundancy monitoring means reads a record of redundancy failure from the state recording means,
A method for controlling an information storage device, comprising: each step in which a reporting unit reports a message to the effect when the redundancy monitoring unit reads a record to the effect of the redundancy failure.
(Appendix 2)
When a failure occurs in maintaining the redundant state of the information, a storage element to which a copy of the information is written is obtained in order to realize the redundancy of the information due to a failure of the storage element included in the information storage device. The control method of the information storage device according to appendix 1, which is formed when the information is lost.
(Appendix 3)
The method of controlling an information storage device according to appendix 1, wherein the step of reading out the redundancy failure from the state recording unit by the redundancy monitoring unit is periodically executed.
(Appendix 4)
The information storage device control method according to appendix 1, wherein the step of reading the redundancy failure from the status recording unit by the redundancy monitoring unit is executed when the information storage device is activated.
(Appendix 5)
An information storage device,
The information stored in the information storage device is made redundant,
Status recording means for recording information relating to the redundancy status;
When a failure occurs in maintaining the redundant state of the information, a redundant failure recording unit that records the redundancy failure in the state recording unit;
Redundancy monitoring means for reading a record of redundancy failure from the state recording means;
An information storage device comprising: reporting means for reporting that the redundancy failure is read by the redundancy monitoring means.
(Appendix 6)
When a failure occurs in maintaining the redundant state of the information, a storage element to which a copy of the information is written is obtained in order to realize the redundancy of the information due to a failure of the storage element included in the information storage device. The information storage device according to appendix 5, which is formed when no longer exists.
(Appendix 7)
The information storage device according to appendix 5, wherein the redundancy monitoring unit periodically reads out a redundancy failure from the state recording unit.
(Appendix 8)
The information storage device according to appendix 5, wherein the redundancy monitoring unit reads out the redundancy failure from the state recording unit when the information storage device is activated.
(Appendix 9)
A program for controlling an information storage device,
The information stored in the information storage device is made redundant,
A redundancy failure recording means for recording a state of the redundancy failure in the state recording means when a failure occurs in maintaining the state in which the information is made redundant, the computer for controlling the information storage device;
Redundancy monitoring means for reading a record of redundancy failure from the state recording means; and
A program including an instruction for functioning as a reporting unit that reports to the effect that a redundancy failure is read by the redundancy monitoring unit.
(Appendix 10)
When a failure occurs in maintaining the redundant state of the information, a storage element to which a copy of the information is written is obtained in order to realize the redundancy of the information due to a failure of the storage element included in the information storage device. The program according to appendix 9, which consists of a case where it disappears.
(Appendix 11)
The program according to appendix 9, wherein the redundancy monitoring unit periodically reads out a redundancy failure from the state recording unit.
(Appendix 12)
The program according to appendix 9, wherein the redundancy monitoring unit reads out a redundancy failure from the state recording unit when the information storage device is activated.
(Appendix 13)
A computer-readable information recording medium storing the program according to any one of appendices 9 to 12.

従来の一例の情報記憶装置の制御方法を説明するためのブロック図である。It is a block diagram for demonstrating the control method of an example of the conventional information storage device. 本発明の一実施例による情報記憶装置の制御方法を実施する機能を有するコンピュータのハードウェア構成について説明するためのブロック図である。It is a block diagram for demonstrating the hardware constitutions of the computer which has a function which implements the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法をコンピュータに実行させるためのプログラムの構成について説明するためのブロック図である。It is a block diagram for demonstrating the structure of the program for making a computer perform the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法を説明するためのブロック図である。It is a block diagram for demonstrating the control method of the information storage device by one Example of this invention. 図4中のHDD二重化制御情報の一例を説明するための図である。FIG. 5 is a diagram for explaining an example of HDD duplication control information in FIG. 4. 本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その1)である。It is a flowchart (the 1) for demonstrating the flow of operation | movement of the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その2)である。It is a flowchart (the 2) for demonstrating the flow of operation | movement of the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その3)である。It is a flowchart (the 3) for demonstrating the flow of operation | movement of the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法の動作の流れを説明するためのフローチャート(その4)である。It is a flowchart (the 4) for demonstrating the flow of operation | movement of the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その1)である。It is a flowchart (the 1) for demonstrating the flow of operation | movement of the expansion | deployment process of HDD duplication control information in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その2)である。It is a flowchart (the 2) for demonstrating the flow of operation | movement of the expansion | deployment process of HDD duplication control information in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その3)である。It is a flowchart (the 3) for demonstrating the flow of operation | movement of the expansion | deployment process of HDD duplication control information in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるHDD二重化制御情報の展開処理の動作の流れを説明するためのフローチャート(その4)である。It is a flowchart (the 4) for demonstrating the flow of operation | movement of the expansion | deployment process of HDD duplication control information in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法における初期化時のハードディスク装置故障検出処理の動作の流れを説明するためのフローチャートである。It is a flowchart for demonstrating the flow of operation | movement of the hard disk apparatus failure detection process at the time of initialization in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の定期監視処理の動作の流れを説明するためのフローチャートである。It is a flowchart for demonstrating the flow of operation | movement of the periodic monitoring process of the hard disk drive failure in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置故障の放置検出処理の動作を説明するためのフローチャートである。It is a flowchart for demonstrating the operation | movement of the neglected detection process of the hard disk apparatus failure in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その1)である。It is a flowchart (the 1) for demonstrating operation | movement of the hard disk drive duplication recovery process in the control method of the information storage device by one Example of this invention. 本発明の一実施例による情報記憶装置の制御方法におけるハードディスク装置二重化復旧処理の動作を説明するためのフローチャート(その2)である。It is a flowchart (the 2) for demonstrating the operation | movement of the hard disk drive duplication recovery process in the control method of the information storage device by one Example of this invention.

符号の説明Explanation of symbols

10 カーネル
20 SVP制御プログラム
21 フレームタスク
23 初期化タスク
24 エラーログタスク
25 パトロールタスク
30 ハードディスクドライバ
31 HDD二重化制御部
31a HDD二重化制御情報
100 SVP
121 ROM
151,152 ハードディスク装置
200 本体装置
10 Kernel 20 SVP Control Program 21 Frame Task 23 Initialization Task 24 Error Log Task 25 Patrol Task 30 Hard Disk Driver 31 HDD Duplication Control Unit 31a HDD Duplication Control Information 100 SVP
121 ROM
151,152 Hard Disk Device 200 Main Device

Claims (10)

情報記憶装置の制御方法であって、
前記情報記憶装置に格納されている情報は冗長化されており、
冗長化障害記録手段が、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録し、
冗長化監視手段が前記状態記録手段から冗長化障害の旨の記録を読み出し、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、通報手段がその旨の通報を行う各段階を備える情報記憶装置の制御方法。
An information storage device control method comprising:
The information stored in the information storage device is made redundant,
When a failure occurs in maintaining the redundant state of the information, the redundant failure recording unit records the redundancy failure in the state recording unit,
The redundancy monitoring means reads a record of redundancy failure from the state recording means,
A method for controlling an information storage device, comprising: each step in which a reporting unit reports a message to the effect when the redundancy monitoring unit reads a record to the effect of the redundancy failure.
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項1に記載の情報記憶装置の制御方法。   When a failure occurs in maintaining the redundant state of the information, a storage element to which a copy of the information is written is obtained in order to realize the redundancy of the information due to a failure of the storage element included in the information storage device. The method of controlling an information storage device according to claim 1, comprising: a case where there is no more. 前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は定期的に実行される構成の請求項1に記載の情報記憶装置の制御方法。   2. The method of controlling an information storage device according to claim 1, wherein the step of reading out the redundancy failure from the state recording unit by the redundancy monitoring unit is periodically executed. 前記冗長化監視手段が前記状態記録手段から冗長化障害の旨を読み出す段階は前記情報記憶装置が起動する際に実行される構成の請求項1に記載の情報記憶装置の制御方法。   2. The method of controlling an information storage device according to claim 1, wherein the step of reading out the redundancy failure from the status recording unit by the redundancy monitoring unit is executed when the information storage device is activated. 情報記憶装置であって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記冗長化の状態に関する情報を記録する状態記録手段と、
前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段と、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段と、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段とを備える情報記憶装置。
An information storage device,
The information stored in the information storage device is made redundant,
Status recording means for recording information relating to the redundancy status;
When a failure occurs in maintaining the redundant state of the information, a redundant failure recording unit that records the redundancy failure in the state recording unit;
Redundancy monitoring means for reading a record of redundancy failure from the state recording means;
An information storage device comprising: reporting means for reporting that the redundancy failure is read by the redundancy monitoring means.
前記情報が冗長化された状態の維持に障害が生じた場合は、前記情報記憶装置が有する記憶素子の故障により前記情報の冗長化を実現するために当該情報のコピーを書き込む記憶素子が得られなくなった場合よりなる請求項5に記載の情報記憶装置。   When a failure occurs in maintaining the redundant state of the information, a storage element to which a copy of the information is written is obtained in order to realize the redundancy of the information due to a failure of the storage element included in the information storage device. The information storage device according to claim 5, wherein the information storage device is configured to disappear. 前記冗長化監視手段は定期的に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。   The information storage device according to claim 5, wherein the redundancy monitoring unit is configured to periodically read a redundancy failure from the state recording unit. 前記冗長化監視手段は前記情報記憶装置の起動時に前記状態記録手段から冗長化障害の旨を読み出す構成の請求項5に記載の情報記憶装置。   6. The information storage device according to claim 5, wherein the redundancy monitoring unit is configured to read out a redundancy failure from the state recording unit when the information storage device is activated. 情報記憶装置を制御するためのプログラムであって、
前記情報記憶装置に格納されている情報は冗長化されており、
前記情報記憶装置を制御するためのコンピュータを、前記情報が冗長化された状態の維持に障害が生じた場合、当該冗長化障害の旨を状態記録手段に記録する冗長化障害記録手段、
前記状態記録手段から冗長化障害の旨の記録を読み出す冗長化監視手段及び、
前記冗長化監視手段により前記冗長化障害の旨の記録が読み出された場合、その旨の通報を行う通報手段として機能させるための命令を含むプログラム。
A program for controlling an information storage device,
The information stored in the information storage device is made redundant,
A redundancy failure recording means for recording a state of the redundancy failure in the state recording means when a failure occurs in maintaining the state in which the information is made redundant, the computer for controlling the information storage device;
Redundancy monitoring means for reading a record of redundancy failure from the state recording means; and
A program including an instruction for functioning as a reporting unit that reports to the effect that a redundancy failure is read by the redundancy monitoring unit.
請求項9に記載のプログラムを格納したコンピュータ読取可能な情報記録媒体。   A computer-readable information recording medium storing the program according to claim 9.
JP2006346213A 2006-12-22 2006-12-22 Information storage device control method, information storage device, control program, and recording medium Expired - Fee Related JP5028998B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006346213A JP5028998B2 (en) 2006-12-22 2006-12-22 Information storage device control method, information storage device, control program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006346213A JP5028998B2 (en) 2006-12-22 2006-12-22 Information storage device control method, information storage device, control program, and recording medium

Publications (2)

Publication Number Publication Date
JP2008158768A true JP2008158768A (en) 2008-07-10
JP5028998B2 JP5028998B2 (en) 2012-09-19

Family

ID=39659611

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006346213A Expired - Fee Related JP5028998B2 (en) 2006-12-22 2006-12-22 Information storage device control method, information storage device, control program, and recording medium

Country Status (1)

Country Link
JP (1) JP5028998B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039841A (en) * 2009-08-12 2011-02-24 Fujitsu Ltd Data migration method and program
JP2012138144A (en) * 2010-12-27 2012-07-19 Hitachi Consumer Electronics Co Ltd Record reproduction device and record reproduction method
JP2013196305A (en) * 2012-03-19 2013-09-30 Fujitsu Ltd Information processing apparatus and maintenance method of information processing apparatus
JP2013254423A (en) * 2012-06-08 2013-12-19 Canon Inc Information processing apparatus and control method, and program
CN111326445A (en) * 2018-12-13 2020-06-23 东京毅力科创株式会社 Substrate processing method and substrate processing apparatus
JP2021006970A (en) * 2019-06-28 2021-01-21 沖電気工業株式会社 Information processing device, abnormality detection method and program
CN119828968A (en) * 2024-12-23 2025-04-15 杭州高特电子设备股份有限公司 Fault recording data storage method, device and storage medium of energy storage system

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0396195A (en) * 1989-09-08 1991-04-22 Fujitsu Ltd Fault notice unit
JPH03222027A (en) * 1990-01-29 1991-10-01 Nec Software Ltd Information processing system
JPH04369710A (en) * 1991-06-18 1992-12-22 Nec Corp Equivalence discriminating system for duplex volume
JPH0527918A (en) * 1991-07-19 1993-02-05 Nec Corp Duplex file data batch copy system
JPH05119926A (en) * 1991-10-30 1993-05-18 Tokyo Electric Co Ltd Information processing equipment
JPH05233158A (en) * 1992-02-20 1993-09-10 Nec Corp Automatic comparison system of duplex disk
JPH07152795A (en) * 1993-11-29 1995-06-16 Nec Corp Logic circuit hierarchy development device
JPH10222315A (en) * 1997-02-12 1998-08-21 Nec Corp Method and device for error recovery of doubled hard disk drives
JP2000305720A (en) * 1999-04-15 2000-11-02 Nec Software Hokkaido Ltd Method for automatically resorting array disk and system therefor
JP2001331347A (en) * 2000-05-22 2001-11-30 Hitachi Ltd Fault information collection method in remote maintenance system
JP2003296044A (en) * 2002-03-29 2003-10-17 Fujitsu Ltd Storage device and status monitoring program

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0396195A (en) * 1989-09-08 1991-04-22 Fujitsu Ltd Fault notice unit
JPH03222027A (en) * 1990-01-29 1991-10-01 Nec Software Ltd Information processing system
JPH04369710A (en) * 1991-06-18 1992-12-22 Nec Corp Equivalence discriminating system for duplex volume
JPH0527918A (en) * 1991-07-19 1993-02-05 Nec Corp Duplex file data batch copy system
JPH05119926A (en) * 1991-10-30 1993-05-18 Tokyo Electric Co Ltd Information processing equipment
JPH05233158A (en) * 1992-02-20 1993-09-10 Nec Corp Automatic comparison system of duplex disk
JPH07152795A (en) * 1993-11-29 1995-06-16 Nec Corp Logic circuit hierarchy development device
JPH10222315A (en) * 1997-02-12 1998-08-21 Nec Corp Method and device for error recovery of doubled hard disk drives
JP2000305720A (en) * 1999-04-15 2000-11-02 Nec Software Hokkaido Ltd Method for automatically resorting array disk and system therefor
JP2001331347A (en) * 2000-05-22 2001-11-30 Hitachi Ltd Fault information collection method in remote maintenance system
JP2003296044A (en) * 2002-03-29 2003-10-17 Fujitsu Ltd Storage device and status monitoring program

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011039841A (en) * 2009-08-12 2011-02-24 Fujitsu Ltd Data migration method and program
US8898394B2 (en) 2009-08-12 2014-11-25 Fujitsu Limited Data migration method
JP2012138144A (en) * 2010-12-27 2012-07-19 Hitachi Consumer Electronics Co Ltd Record reproduction device and record reproduction method
JP2013196305A (en) * 2012-03-19 2013-09-30 Fujitsu Ltd Information processing apparatus and maintenance method of information processing apparatus
JP2013254423A (en) * 2012-06-08 2013-12-19 Canon Inc Information processing apparatus and control method, and program
CN111326445A (en) * 2018-12-13 2020-06-23 东京毅力科创株式会社 Substrate processing method and substrate processing apparatus
JP2021006970A (en) * 2019-06-28 2021-01-21 沖電気工業株式会社 Information processing device, abnormality detection method and program
JP7275922B2 (en) 2019-06-28 2023-05-18 沖電気工業株式会社 Information processing device, anomaly detection method and program
CN119828968A (en) * 2024-12-23 2025-04-15 杭州高特电子设备股份有限公司 Fault recording data storage method, device and storage medium of energy storage system

Also Published As

Publication number Publication date
JP5028998B2 (en) 2012-09-19

Similar Documents

Publication Publication Date Title
US6052758A (en) Interface error detection and isolation in a direct access storage device DASD system
JP5887757B2 (en) Storage system, storage control device, and storage control method
US7827367B2 (en) Backup control method for acquiring plurality of backups in one or more secondary storage systems
EP1397744B1 (en) Recovery computer for a plurality of networked computers
JP4884885B2 (en) Storage controller and storage controller failure recovery method
JP5052193B2 (en) Storage control device and storage control method
EP1435575A2 (en) Method and apparatus for maintaining consistency of data stored in a group of mirroring devices
US20140019802A1 (en) Multiple hyperswap replication sessions
US8751878B1 (en) Automatic failover during online data migration
JP2002328815A (en) Method of on-line removal of controller from redundant controller elimination system
CN1081005A (en) Adapters for forming redundant disk storage systems
JP2011128917A (en) Data allocation control program, data allocation control method, and data allocation control apparatus
JPH08335144A (en) External storage device
US10025655B2 (en) Storage system
JP5028998B2 (en) Information storage device control method, information storage device, control program, and recording medium
JPH11353129A (en) Magnetic disk drive capable of replacing magnetic disk during operation and method of replacing magnetic disk
JPH09269871A (en) Data re-redundancy method in disk array device
JP6083480B1 (en) Monitoring device, fault tolerant system and method
US20090150459A1 (en) Highly available multiple storage system consistency heartbeat function
JP2016057876A (en) Information processing apparatus, input / output control program, and input / output control method
JP5104479B2 (en) Information processing device
JP3776438B2 (en) Storage device
JPH10275060A (en) Array disk controller
JP6911591B2 (en) Information processing device, control device and control method of information processing device
US7962781B2 (en) Control method for information storage apparatus, information storage apparatus and computer readable information recording medium

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090907

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20111122

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120113

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20120207

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120502

A911 Transfer of reconsideration by examiner before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20120509

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120529

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120611

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150706

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees