JP2005301350A - Fault tolerant server - Google Patents
Fault tolerant server Download PDFInfo
- Publication number
- JP2005301350A JP2005301350A JP2004112114A JP2004112114A JP2005301350A JP 2005301350 A JP2005301350 A JP 2005301350A JP 2004112114 A JP2004112114 A JP 2004112114A JP 2004112114 A JP2004112114 A JP 2004112114A JP 2005301350 A JP2005301350 A JP 2005301350A
- Authority
- JP
- Japan
- Prior art keywords
- disk
- disk array
- master
- slave
- array controller
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000004891 communication Methods 0.000 claims description 5
- 229920005994 diacetyl cellulose Polymers 0.000 description 34
- 238000010586 diagram Methods 0.000 description 5
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000000034 method Methods 0.000 description 1
Images
Abstract
Description
本発明はフォールトトレラントサーバに関し、特に、外部記憶装置などの周辺機器とのインタフェース部等をモジュール化し、多重化したフォールトトレラントサーバに関する。 The present invention relates to a fault-tolerant server, and more particularly to a fault-tolerant server in which an interface unit with a peripheral device such as an external storage device is modularized and multiplexed.
フォールトトレラントサーバは、CPUや、外部記憶装置などの周辺機器とのインタフェース部等をモジュール化し、多重化することで、対故障設計されている。またインタフェース部は、一つをマスタ、その他をスレーブとして動作させ、正常時はマスタ経由、障害時はスレーブ経由で外部記憶装置などの周辺機器とのI/Oを行っている。 The fault-tolerant server is designed to be fault-tolerant by modularizing and multiplexing an interface unit with peripheral devices such as a CPU and an external storage device. The interface unit operates as one master and the other as slaves, and performs I / O with peripheral devices such as an external storage device via the master when normal and via the slave when a failure occurs.
例えば、特許文献1には、原用及び予備系のCPUの両者に2重化されたディスク制御装置がそれぞれ接続され、各ディスク制御装置はそれぞれ原用及び予備系のディスクと接続され、片系のディスク制御装置に障害が発生しても両系のディスクに対して同一データの二重書きをなすことが可能なものが開示されている。
For example, in
外部記憶装置に対する信頼性を向上させるためには、ディスクアレイ装置を備えることにより実現できるが、ディスクアレイコントローラ部を筐体内にもつ高価な外付ディスクアレイ装置が必要となる。このかわりにOSによりソフト的なミラーリングを行うことも考えられるが、ハード的構造に対して耐障害性が下がり、また、CPUリソースが必要なことから処理能力の低下のおそれがあった。 In order to improve the reliability of the external storage device, it can be realized by providing a disk array device, but an expensive external disk array device having a disk array controller unit in the housing is required. Instead of this, it is conceivable to perform soft mirroring with the OS, but the fault tolerance with respect to the hardware structure is reduced, and the CPU resources are required, so that the processing capability may be reduced.
本発明のフォールトトレラントサーバは、CPUモジュールと、マスタ/スレーブとして動作する多重化されたPCIモジュールと、複数のディスクと、前記多重化されたPCIモジュールにそれぞれ対応しお互いを仮想的なI/Oデバイスとして認識して通信を行い複数のディスクのディスク構成情報を共有するディスクアレイコントローラとを有する。 The fault tolerant server of the present invention includes a CPU module, a multiplexed PCI module operating as a master / slave, a plurality of disks, and a virtual I / O corresponding to each of the multiplexed PCI modules. A disk array controller that communicates by recognizing as a device and sharing the disk configuration information of a plurality of disks.
本発明によれば、マスタ/スレーブとして動作するPCIモジュールに搭載された各ディスクアレイコントローラを、お互いに仮想的なI/Oデバイスとして認識させることにより、既存のSCSI等をインタコネクトとして利用してディスクアレイコントローラ間の通信を行い、ディスク構成情報、障害情報等の共有を行う。これにより、高価な外付ディスクアレイ装置やソフトミラーリングを用いずに、既存レベルのディスクアレイコントローラとディスクエンクロージャーを利用した安価なフォールトトレラントサーバ向けのハードウェアRAID環境の構築が可能となる。 According to the present invention, each disk array controller mounted on a PCI module operating as a master / slave is mutually recognized as a virtual I / O device, so that existing SCSI or the like can be used as an interconnect. Communication between disk array controllers is performed to share disk configuration information, failure information, and the like. This makes it possible to construct a hardware RAID environment for an inexpensive fault-tolerant server using an existing level disk array controller and disk enclosure without using an expensive external disk array device or soft mirroring.
次に、本発明を実施するための最良の形態について図面を参照して詳細に説明する。 Next, the best mode for carrying out the present invention will be described in detail with reference to the drawings.
図1に示すように、フォールトトレラントサーバ100は、CPUモジュール1,2それぞれに、PCIモジュール3,4を接続し、PCIモジュール3,4それぞれに共用のデバイスユニット(以下、DEUという)9を接続する構成とする。DEU9は、ディスクHDD01〜N−1を含み、PCIモジュール3,4は、それぞれPCIスロット5,6を備え、PCIスロット5,6にはディスクアレイコントローラ(以下DACという)7,8が装着されている。二重化の対象となる2枚のDAC7,8は、SCSI等により相互接続され、SCSI等のプロトコルを用いて情報を通信する。また、ディスクHDD01〜N−1は、DAC7,8の通信経路上に接続される。
As shown in FIG. 1, the fault tolerant server 100 connects PCI modules 3 and 4 to the
PCIモジュール3,4は互いにマスタ/スレーブとして動作し、正常動作時、CPUモジュール1,2とDEU9との間のI/Oは、マスタ側PCIモジュールを経由して行われる。また障害発生時にはスレーブ側を介した経路に変更してCPUモジュール1,2がDEU9へのアクセスを行う。
The PCI modules 3 and 4 operate as master / slave with each other, and during normal operation, I / O between the
CPUモジュール1,2は、それぞれCPU(図示せず)と、メモリ(図示せず)と、PCIモジュール3,4に対するインタフェースを行うコントローラ(図示せず)とを備え、PCIモジュール3,4は、それぞれCPUモジュール1,2に対するインタフェースを行うコントローラ(図示せず)を備えている。
Each of the
図2は、図1のDAC7,8及びDEU9の詳細の構成を示すブロック図である。
FIG. 2 is a block diagram showing a detailed configuration of the
DAC7,8は主に、仮想デバイスユニット(以下VDUという)12,16、本体側I/F10,20、ディスク側I/F11,21、ディスク構成情報テーブル13,17、キャッシュコントローラ14,18、キャッシュ15,19からなる。ディスク構成情報テーブル13は、HDD01〜N−1のRAID構成情報を保持する。
The
VDU12,16は、接続した1組のDAC7,8が、互いにディスクHDD01〜N−1と同レベルの仮想的なI/Oデバイスとして認識するよう処理を行う。具体的には、マスター側VDUは、スレーブ側VDUに対しID=0をもつデバイスとして認識され、スレーブ側VDUは、マスター側VDUにID=N(DACで採用するプロトコルの最大接続デバイスID)として認識させるよう処理を行う。これによりマスター側VDUとスレーブ側VDUとは、ディスクHDD01〜N−1が接続された通信経路を経由して相手のVDUをターゲットとして指定することでSCSI等のプロトコルを用いて情報伝送を行うことができる。
VDU12又はVDU16は、DAC7又はDAC8がマスタ側DACとして動作中の場合は、スレーブ側のディスク構成情報テーブル13又はディスク構成情報テーブル17へディスク構成情報の送信を行い、ディスクの障害情報の共有を行う。またキャッシュコントローラの情報制御を行い、マスタ側であるDAC7又はDAC8のキャッシュ15またはキャッシュ19の状態の変更情報の送信を行う。また、DAC7又はDAC8がスレーブ側DACとして動作中の場合は、マスタ側であるVDU16又はVDU12からの情報を受信し、待機中のDAC7又はDAC8のキャッシュ15又はキャッシュ19、ディスク構成情報テーブル13又はディスク構成情報テーブル17のディスク構成情報の更新を行う。
The VDUs 12 and 16 perform processing so that the pair of connected
When the
またCPUモジュール1,2からディスクHDD01〜N−1にアクセスを行うと、マスター側のDAC7又はDAC8において、本体側I/F10又は本体側I/F20からVDU12又はVDU16へデータ入力があり、VDU12又はVDU16がマスターとしてスレーブ側VDU16又はVDU12への情報送信を行う。スレーブ側のDAC8又はDAC7においては、本体側I/F20又は本体側I/F10からVDU12又はVDU16へデータ入力がなく、VDU12又はVDU16はスレーブとしてマスター側のVDU16又はVDU12からの情報の受信を行う。
When the
また、DAC7,8は、初期状態でのディスクアレイ構成を行う際に、マスタ側DACとして動作中の場合は、ディスク構成情報をスレーブ側DACに送信する。また、マスタ側DACからスレーブ側DACへ情報を通知するのとあわせて、マスタ側DACがディスクHDD01〜N−1へも同様の構成情報を書き込む。この情報はマスタ側DAC7に障害が発生した場合、その交換復旧に際してDAC7、8、ディスクの3種の情報を比較し多数決をとることで復旧時の情報を決定するのに用いられる。
Further, when performing the disk array configuration in the initial state, the
また、VDU12,16はデータアクセス時において、ディスク構成情報テーブル13,17、キャッシュコントローラ14,18の情報制御を行い、ディスクHDD01〜N−1の障害情報の共有、マスタ側DACのキャッシュ状態の変更情報を受信し、待機中のDACのキャッシュの更新を行う。
Further, the VDUs 12 and 16 control information of the disk configuration information tables 13 and 17 and the
次に本発明の変形例について説明する。図3は図2の変形例を示すブロック図である。 Next, a modified example of the present invention will be described. FIG. 3 is a block diagram showing a modification of FIG.
図2の例では、ディスクHDD01〜N−1上にディスク構成情報22を保持するのみであるが、本変形例ではそれに加えディスク上にキャッシュ情報23等、マスタ側DACからスレーブ側DACへ送信する情報すべてをディスクHDD01〜N−1の情報保持領域に保持し、マスタ側VDUからディスクHDD01〜N−1へのデータ書き込みとあわせて当該領域への書き込みを実施する点で異なる。これによりVDU自身は相手からデバイスとして認識されることなくターミネーションとして動作し、マスタ側DACの障害により、上位からスレーブ側への入力が発生した時点で、スレーブ側VDUはディスク構成情報22等を読み込み処理を継続する。これによりマスタ/スレーブ間の通信量を減らし処理効率を向上することが可能となる。
In the example of FIG. 2, only the
外部記憶装置などの周辺機器とのインタフェース部等をモジュール化し、二重化したフォールトトレラントサーバに利用可能である。 It can be used in a fault-tolerant server that has a modularized interface unit with peripheral devices such as an external storage device.
1,2 CPUモジュール
3,4 PCIモジュール
5,6 PCIスロット
7,8 ディスクアレイコントローラ
9 デバイスユニット
10,20 本体側I/F
11,21 ディスク側I/F
12,16 仮想デバイスユニット
13,17 ディスク構成情報テーブル
14,18 キャッシュコントローラ
15,19 キャッシュ
22 ディスク構成情報
23 キャッシュ情報
100 フォールトトレラントサーバ
1, 2 CPU module 3, 4 PCI module 5, 6
11, 21 Disc side I / F
12, 16 Virtual device unit 13, 17 Disk configuration information table 14, 18
Claims (4)
2. The disk array controller according to claim 1, wherein each of the disk array controllers has a cache, and when the disk array controller is operating as a master disk array controller, the cache information is transmitted to the slave disk array controller and written to the plurality of disks. 3. The fault tolerant server according to 3.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004112114A JP2005301350A (en) | 2004-04-06 | 2004-04-06 | Fault tolerant server |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2004112114A JP2005301350A (en) | 2004-04-06 | 2004-04-06 | Fault tolerant server |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2005301350A true JP2005301350A (en) | 2005-10-27 |
Family
ID=35332853
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2004112114A Withdrawn JP2005301350A (en) | 2004-04-06 | 2004-04-06 | Fault tolerant server |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2005301350A (en) |
-
2004
- 2004-04-06 JP JP2004112114A patent/JP2005301350A/en not_active Withdrawn
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8074105B2 (en) | High data availability SAS-based RAID system | |
| TWI378349B (en) | Computer system, storage virtualization subsystem, storage virtualization controller, and method for storage virtualization | |
| US7444541B2 (en) | Failover and failback of write cache data in dual active controllers | |
| US8020035B2 (en) | Expander circuit for a solid state persistent storage device that provides a plurality of interfaces to corresponding storage controllers | |
| US7487285B2 (en) | Using out-of-band signaling to provide communication between storage controllers in a computer storage system | |
| CN100470494C (en) | Cluster availability management method and system | |
| JP5511960B2 (en) | Information processing apparatus and data transfer method | |
| US9411764B2 (en) | Optimized redundant high availability SAS topology | |
| US9830238B2 (en) | Techniques for maintaining communications sessions among nodes in a storage cluster system | |
| JP5523468B2 (en) | Active-active failover for direct attached storage systems | |
| JP5903801B2 (en) | Communication apparatus and ID setting method | |
| GB2419984A (en) | Communication in a Serial Attached SCSI storage network | |
| JP5695126B2 (en) | Computer system, server module and storage module | |
| US20120297107A1 (en) | Storage controller system with data synchronization and method of operation thereof | |
| KR20100132899A (en) | Concurrent Intermediate Proxy Direct Memory Access | |
| JP2007086972A (en) | Storage system, duplex control method, and program | |
| WO2021012169A1 (en) | Method of improving reliability of storage system, and related apparatus | |
| JP2009053946A (en) | Redundant controller block device controller | |
| US20080126851A1 (en) | Redundant storage enclosure processor (sep) implementation for use in serial attached scsi (sas) environment | |
| US7797394B2 (en) | System and method for processing commands in a storage enclosure | |
| JP2005301350A (en) | Fault tolerant server | |
| JP4755050B2 (en) | Data processing apparatus, mode management apparatus, and mode management method | |
| JP2011076528A (en) | Method and device for providing redundancy to raid card | |
| US11366618B2 (en) | All flash array server and control method thereof | |
| US11570282B2 (en) | Using high speed data transfer protocol |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Withdrawal of application because of no request for examination |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20070703 |