[go: up one dir, main page]

JP2006092070A - ディスクアレイ装置及びその制御方法並びに制御プログラム - Google Patents

ディスクアレイ装置及びその制御方法並びに制御プログラム Download PDF

Info

Publication number
JP2006092070A
JP2006092070A JP2004274469A JP2004274469A JP2006092070A JP 2006092070 A JP2006092070 A JP 2006092070A JP 2004274469 A JP2004274469 A JP 2004274469A JP 2004274469 A JP2004274469 A JP 2004274469A JP 2006092070 A JP2006092070 A JP 2006092070A
Authority
JP
Japan
Prior art keywords
disk
physical disk
response time
array device
physical
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004274469A
Other languages
English (en)
Inventor
Manabu Miyazaki
学 宮崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2004274469A priority Critical patent/JP2006092070A/ja
Priority to US11/230,534 priority patent/US20060069866A1/en
Publication of JP2006092070A publication Critical patent/JP2006092070A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0628Interfaces specially adapted for storage systems making use of a particular technique
    • G06F3/0653Monitoring storage devices or systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0602Interfaces specially adapted for storage systems specifically adapted to achieve a particular effect
    • G06F3/0614Improving the reliability of storage systems
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/06Digital input from, or digital output to, record carriers, e.g. RAID, emulated record carriers or networked record carriers
    • G06F3/0601Interfaces specially adapted for storage systems
    • G06F3/0668Interfaces specially adapted for storage systems adopting a particular infrastructure
    • G06F3/0671In-line storage system
    • G06F3/0683Plurality of storage devices
    • G06F3/0689Disk arrays, e.g. RAID, JBOD

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Debugging And Monitoring (AREA)

Abstract

【課題】 ディスクアレイ装置を構成する各物理ディスクの性能劣化を精度よく検出し、障害の発生を未然に防ぐこと。
【解決手段】 複数の物理ディスクを装備したディスクアレイ装置であって、各物理ディスクへのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段と、各物理ディスクの応答時間と、複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する性能劣化判断手段と、を備えた。
【選択図】図1

Description

本発明は、ディスクアレイ装置にかかり、特に、性能劣化したディスクの検出を行うディスクアレイ装置に関する。また、上記検出を行うディスクアレイ装置の制御方法、及び、制御プログラムに関する。
近年、オンデマンドの映像配信サービスに見られるように、記憶装置に記憶された大量のデータに対して遅延なくアクセスする必要性が高まっている。そして、映像配信ほどではないにしろ、オンライントランザクション処理においてもサーバの性能向上に合わせ、ストレージに要求される処理性能も厳しくなっている。このような要求に対して複数のディスクを並列にアクセスすることで処理性能を上げるRAIDを使ったディスクアレイ装置が注目を浴び、広く使用されている。RAIDはさまざまな種類が研究されているが、機能を大きく2つに分けると、1つ目はデータに冗長性を持たせることでデータの損失確率を減らすことであり、2つ目は複数のディスクへの並列アクセスで性能を向上させることである。
従来のディスクアレイ装置ではデータの保持に重点が置かれており、ディスクが発行するなんらかのエラーイベントを検知して、障害ディスクを決定し、交換していた。例えば、下記の特許文献1には、ディスクアレイ装置のエラー発生頻度に応じてディスクを自動交換する技術が開示されている。
ところが、エラーイベントは検知できなくとも性能劣化が発生することはあるため、この性能劣化を早急に検知することが必要とされている。そのような技術として、下記の特許文献2に示すように、ディスクの応答時間を計測して基準値と比較し、性能劣化を検出する、という手法が公開されている。また、性能劣化を検出した後に、ブロック障害であるとして、当該一部のブロックを予備と交換する手法も知られている。
特開平11−345095号公報 特開平4−305865号公報
しかしながら、上記従来例には、以下のような問題があった。まず、第1の問題は、従来の性能劣化を判断する方法は、物理ディスクへの各IO要求の時間を測定し、それを基準値と比較するという方法であるため、ディスクの種類、IOのサイズ負荷状況など様々な条件によって劣化と判断する応答時間の絶対値が変化し、基準値の設定が容易でないことである。すなわち、仮に基準値を設定したとしても、性能劣化が生じたか否かを精度よく判断することができない、という問題が生じる。
また、第2の問題は、性能劣化の原因がブロック障害以外にあった場合に、性能劣化を改善できないということである。すなわち、ディスクアレイ装置に発生している性能劣化は、非常に大規模なOLTP環境で発生しており、ランダムアクセス時に定常的に発生することから、一部のブロック障害では原因を説明できない性能劣化現象が発生することがある。
このため、本発明では、ディスクアレイ装置を構成する各物理ディスクの性能劣化を精度よく検出し、障害の発生を未然に防ぐ、ことをその目的とする。
そこで、本発明であるディスクアレイ装置は、
複数の物理ディスクを装備したディスクアレイ装置であって、
各物理ディスクへのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段と、
各物理ディスクの応答時間と、複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する性能劣化判断手段と、
を備えたことを特徴としている。
上記発明によると、まず、複数の物理ディスクに対してアクセスしたときの応答時間をそれぞれ計測する。そして、複数の物理ディスクの応答時間と、特定の物理ディスクの応答時間とを比較して、当該特定の物理ディスクの性能が劣化しているか否かを判断する。従って、特定の物理ディスクの性能劣化を、他の物理ディスクの性能と比較することで検出するため、絶対値との比較により劣化を判断する従来例とは異なり、ディスクの種類や負荷状況に依存することなく、高精度に性能劣化を検出することができる。
また、性能劣化判断手段は、各物理ディスクの応答時間の平均値を算出すると共に、この平均値と特定の物理ディスクの応答時間とを比較して、当該特定の物理ディスクの性能劣化を判断する、ことを特徴としている。このとき、性能劣化判断手段は、応答時間の平均値を算出する際に、特定の物理ディスクを除いた他の物理ディスクの応答時間の平均値を算出する、という構成にすると望ましい。このように、応答時間の平均値を比較対象とすることで、標準的な応答時間との対比のもとで性能劣化判断を行うことができ、より高精度に性能劣化判断を行うことができる。
また、性能劣化判断手段は、各物理ディスクの応答時間の平均値と、特定の物理ディスクの応答時間との比に基づいて、当該特定の物理ディスクの性能劣化を判断する、ことを特徴としている。このとき、性能劣化判断手段は、各物理ディスクの応答時間の平均値と特定の物理ディスクの応答時間との比と、予め設定された基準比とを比較して、その比較結果に基づいて特定の物理ディスクの性能劣化を判断する、ことを特徴としている。
また、性能劣化判断手段は、特定の物理ディスクの応答時間Tの各物理ディスクの応答時間の平均値Taに対する比(T/Ta)と、予め設定された基準比(例えば、2)とを比較して、当該基準比よりも上記比(T/Ta)が高い場合に特定の物理ディスクの性能が劣化したと判断する、ことを特徴としている。
これにより、特定の物理ディスクの応答時間と平均値との比を算出して、かかる値に基づいて判断することにより、劣化判断が容易かつ高速となる。特に、算出した比を予め設定された基準比と比較することにより性能の劣化を判断することで、より確実かつ迅速に、性能が劣化した物理ディスクの検出を行うことができる。
さらに、上記構成に加えて、
アクセス対象となる各物理ディスクのほかに少なくとも1つの予備物理ディスクを備えると共に、
性能劣化判断手段にて、特定の物理ディスクの性能が劣化していると判断されたときに、当該特定の物理ディスクに換えて予備物理ディスクを使用可能なよう交換処理を行うディスク交換手段を備えた、ことを特徴としている。
これにより、性能劣化の物理ディスクが自動的に交換されるため、物理ディスクに依存する全ての性能劣化により生じうるディスクアレイ装置の障害を事前に回避することができる。
また、本発明では、複数の物理ディスクを装備したディスクアレイ装置の動作を制御する制御部に、
各物理ディスクへのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段と、
各物理ディスクの応答時間と、複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する性能劣化判断手段と、
を実現するためのディスクアレイ装置の制御プログラムをも提供している。
そして、上記プログラムにより実現される性能劣化判断手段は、各物理ディスクの応答時間の平均値を算出すると共に、この平均値と特定の物理ディスクの応答時間とを比較して、当該特定の物理ディスクの性能劣化を判断する、
ことを特徴としている。
さらに、本発明では、ディスクアレイ装置の制御方法をも提供しており、
ディスクアレイ装置に装備された複数の物理ディスクへのアクセスに対する応答時間をそれぞれ計測し、
各物理ディスクの応答時間と、複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する、ことを特徴としている。このとき、特定の物理ディスクの性能劣化判断を、各物理ディスクの応答時間の平均値を算出し、この平均値と特定の物理ディスクの応答時間とを比較して行う、ことを特徴としている。
以上のような構成の制御プログラム、制御方法であっても、上述したディスクアレイ装置と同様に作用するため、ディスクアレイ装置を構成する各物理ディスクの性能劣化を精度よく検出する、という上記目的を達成することができる。
本発明は、以上のように構成され機能するので、これによると、特定の物理ディスクの性能劣化を、他の物理ディスクの性能と比較することで検出するため、絶対値との比較により劣化を判断する従来例とは異なり、ディスクの種類や負荷状況に依存することなく、高精度に性能劣化を検出することができる。そして、実際にディスクに障害が生じる前に性能劣化を検出できるため、適切な障害対策を採ることができ、ディスクアレイ装置の信頼性の向上を図ることができる、という従来にない優れた効果を有する。
本発明は、複数ディスクでRAIDを構成しているディスクアレイ装置において、特定の物理ディスクの性能劣化を、同じRAIDを構成する他の物理ディスクと応答時間を比較して検出する、ことに特徴を有する。これにより、ディスクの種類や負荷状況に依存することなく、性能劣化を判断でき、また、交換単位をディスクとすることでディスクに関わる全ての障害を改善できる。以下、具体的な構成を、実施例にて説明する。
本発明の第1の実施例を、図1乃至図4を参照して説明する。図1は、ディスクアレイ装置の構成を示すブロック図である。図2は、ディスクアレイ装置内のプロセッサの構成を示す機能ブロック図である。図3乃至図4は、ディスクアレイ装置の動作を示すフローチャートである。
<構成>
図1に示すように、本発明のディスクアレイ装置1は、IOを要求するホストコンピュータ2と接続されており、このホストコンピュータ2からIO要求を受けて、物理ディスクへIOを制御するコントローラ10と、複数の物理ディスクから構成される物理ディスクグループ20と、を備えて構成されている。
物理ディスクグループ20は、RAID構成に使用されていて実際のアクセスが発生するRAID構成済みの物理ディスク21(21a,21b,21n等)と、RAIDに使用されておらず障害発生時の交換用の予備物理ディスクであるスペア物理ディスク22(22a,22b等)との集合として構成されている。なお、物理ディスク21及びスペア物理ディスク22の装備数は、図示する数に限定されない。
コントローラ10は、プロセッサ100とイベントを記録するイベントログ110とを含んで構成される。プロセッサ100は、演算装置(制御装置)であり、ディスクアレイ装置1の制御用プログラムが組み込まれることで、図2に示すように、IO処理部101、応答時間測定部102、性能劣化判断処理部103、イベント処理部104、ディスク交換処理部105が構築される。ここで、上記各処理部101〜105による機能を詳述する。
IO処理部101は、ホストコンピュータ2からの指令に応じて、RAID構成済みの各物理ディスク21に対してアクセスし、データの記録再生処理を行う。また、各物理ディスク21に対するアクセスする際に、アクセス開始時と物理アクセスからの応答受取時に、その旨を応答時間測定部102に通知する。なお、このIO処理部101は、通常のIO機能も果たすことから、物理ディスク21に対するデータの記録再生結果をホストコンピュータ2に通知する。
応答時間測定部102は、IO処理部101からの通知に応じて、各物理ディスク21の応答時間を計測する。すなわち、上記IO処理部101とこの応答時間測定部102とにより、各物理ディスク21へのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段が構成されている。そして、応答時間測定部102は、計測した応答時間を、性能劣化判断処理部103に通知する。
性能劣化判断処理部103(性能劣化判断手段)は、計測した各物理ディスク21の応答時間の平均値Taを算出する。ここでは、RAIDを構成している物理ディスク21全ての応答時間の平均を算出することとする。その後、各物理ディスク(例えば、符号21aにて示すもの)を特定の物理ディスクとして、当該特定の物理ディスクの応答時間Tの上記平均値Taに対する比(T/Ta)(以下、「劣化比」という)を算出する。そして、この劣化比(T/Ta)を、予め性能劣化判断処理部103に組み込まれた基準比と比較し、その大小を調べる。このとき、特定の物理ディスク21aの応答時間Tが、平均値Taよりも遅延している場合には、上記算出した劣化比(T/Ta)の値が1以上となり、その遅延が大きくなるにつれて比の値が大きくなる。従って、性能劣化を判断しうる基準比の値として、性能劣化と判断しうる値を予め理論式や実験に求めて設定しておく。
そして、性能劣化判断処理部104は、上記算出した劣化比(T/Ta)が基準比よりも大きい(あるいは等しい)場合に、現在対象としている特定の物理ディスク21aの性能が劣化したと判断する。そして、特定の物理ディスクを他の物理ディスクに変更して(例えば、次は符号21bに示す物理ディスク)、上記性能劣化の判断処理を行い、全ての物理ディスクが終了するまで繰り返す。すなわち、各物理ディスクごとに上記劣化比(T/Ta)をそれぞれ求めて基準比と比較して、各物理ディスクの性能が劣化しているか否かを判断する。そして、各物理ディスクごとの判断結果を、イベント処理部104に通知する。
なお、上記のように、本発明にて、同じRAIDを構成している他の物理ディスクと応答時間を比較する手法を採っている理由は、以下のとおりである。これは同じRAIDを構成している物理ディスクは同じ種類のディスクが使用されており、同じストライプサイズでRAIDを構成することからIOのサイズは一様、負荷状況も同じであり、比較対象として適切であることが理由である。また実験より、負荷特性によっては正常なディスク同士であっても、応答時間は物理ディスクごとに最大と最小で1.5倍程度の差分があることがわかっている。そこで判定の正確性を向上させるために、RAIDで使用される物理ディスクの応答時間の平均を計算し、それと各物理ディスクの応答時間を比較する。実験ベースでは平均値と比較して正常なディスクの応答時間が2倍以上長くなる現象は見られず、これを性能劣化の判断基準とする。すなわち、上記基準比の値を「2」として、劣化比がこれより大きい場合には、性能劣化と判断するとよい。但し、基準比の値は、かかる値に限定されるものではない。
ここで、上記劣化判断処理部104による性能劣化判断処理は、上記手法に限定されない。例えば、物理ディスク21全てにおける応答時間の平均値Taは、劣化判断対象となる特定の物理ディスクを除いた他の物理ディスクの応答時間の平均値Taであってもよい。従って、符号21aの物理ディスクの劣化を判断する際には、他の物理ディスク21b,21n等の平均値Taを求めて、これと符号21aに示す物理ディスクの応答時間の劣化比を用いてもよい。さらには、上述したように劣化比を算出して性能劣化を判断することに限定されず、他の演算にて判断を行ってもよい。例えば、各物理ディスク21の応答時間と、特定の物理ディスクの応答時間とに基づいて、それらの大小を比較するなど、他の演算を行うことで、特定の物理ディスクの性能劣化を判断するよう作動してもよい。
そして、上記イベント処理部104は、上記性能劣化判断処理部103からの通知に応じて、イベントログ110に性能劣化と判断された物理ディスクに対するイベントを記録する。また、さらに、上記イベントに関する情報、すなわち、性能劣化と判断された物理ディスクを特定する情報と、そのときの劣化比(T/Ta)をディスク交換処理部105に通知する。
ディスク交換処理部105(ディスク交換手段)は、通知された劣化比(T/Ta)を調べ、予め設定されている交換基準比と比較する。この交換基準比は、例えば「3」であり、上述した劣化と判断される基準比よりもはるかに大きい値であり、特定の物理ディスクの応答時間が平均値よりも3倍も遅延していることを意味している。そして、この値以上となると、ディスク交換処理部105は、特定の物理ディスク21に換えてスペア物理ディスク22を使用可能なよう交換処理を行う。例えば、RAIDを構成している物理ディスク21aが上記のように交換が必要であると判断されると、当該物理ディスク21a内のデータをスペア物理ディスク22aにコピーし、当該スペア物理ディスク22aを物理ディスク21aと交換してRAIDを構成するよう設定する。但し、実際に交換処理を実行するとなると、当該交換処理は物理ディスクの単位で実施するため時間がかかることから、ユーザが交換のタイミングを設定しておく。例えば、予め業務停止の時間を自動交換可能時間帯として設定しておくことで、上述したように交換処理を行うと判断された物理ディスク21aは、設定された業務停止時間となったタイミングで実行される。なお、交換時期などは、さまざまな条件にてユーザに設定されてもよい。
なお、上記では、算出した比(T/Ta)が平均値の3倍以上となった場合に、交換処理が実行される場合を例示したが、交換基準比は上記値に限定されない。また、上述したように、性能劣化判断処理部103にて性能劣化と判断された時点で、ディスク交換処理が実行されるよう設定されていてもよい。
<動作>
次に、上記構成のディスクアレイ装置1の動作を、図3乃至図4のフローチャートを参照して説明する。図3は、主に、性能劣化判断処理の動作を示すフローチャートであり、図4は、主に、ディスク交換処理の動作を示すフローチャートである。
まず、プロセッサ100、つまり、IO処理部101は、ホストコンピュータ2からIO要求を受信すると(ステップS1)、構成中のRAID情報からIOを発行する物理ディスク21を決定し、各RAID構成中の物理ディスク21へ並列にIOを発行する(ステップS2)。そして、応答時間測定部102と連携して、各RAID構成中の物理ディスク21に対するIOの応答時間の測定を開始する(ステップS3)。
その後、IO処理部101が各RAID構成中の物理ディスク21からの結果を受け取る(ステップS4)と、応答時間測定部102と連携して、各RAID構成中の物理ディスク21に対するIOの応答時間の測定も終了させる(ステップS5)。そして、IO処理部101は、ホストコンピュータ2へIOの結果を送信する(ステップS6)。
その後、応答時間測定部102にて計測された応答時間は、性能劣化判断処理部103に通知され、当該性能劣化判断処理部103では、各RAID構成中の物理ディスク21の応答時間の平均値を計算(ステップS7)し、平均値とRAID構成中のそれぞれの物理ディスク21の応答時間との比(劣化比)を求める(ステップS8)。そして、それぞれの物理ディスク21に対する応答時間とそれらの平均値との劣化比が、2以上の物理ディスクがあるかどうかを判断し、2未満であれば性能劣化はないと判断し(ステップS8にて否定判断)、IO処理部101に通知して、IO処理が終了でなければ(ステップS10にて否定判断)ステップS1へ戻り、IOの処理を継続する。一方、劣化比が2以上のディスクがあれば、そのディスクと特定する情報と共に応答時間の性能が劣化していると判断し、その旨をイベント処理部104に通知する。そして、イベント処理部104では、通知をうけた内容のイベントを、コントローラ10のイベントログ110に記録する(ステップS9)。
次に、プロセッサ100が物理ディスクの交換処理を行う際の動作を図4を参照して説明する。すなわち、イベント処理部104からイベント発生の通知を受けたディスク交換処理部105による動作である。
まず、プロセッサ100は交換処理をするためにイベントを待ちつつ、既に交換が必要な物理ディスク21が存在するか否かを調べる(ステップS21)。ここでは、まだ交換すべき物理ディスク21は存在しない(ステップS21にて否定判断)。
そして、上述したように、特定の物理ディスク21の上記劣化比(T/Ta)が2以上となると性能劣化イベントが発生し、これを検知すると(ステップS23にて肯定判断)、交換が必要かどうかの判断を行う(ステップS24)。具体的には、上記劣化比(T/Ta)と、ユーザが予め設定した交換基準比(例えば、「3」に設定された値)を比較し、当該交換基準比を越えていなければ(ステップS24にて否定判断)、イベント待ち状態に戻る(ステップS21,S23)。一方、ユーザの設定した交換基準比を越えていると判断されると(ステップS24にて肯定判断)、ユーザの設定した交換のタイミング条件を満たしているか否かを調べる(ステップS25)。例えば、予め業務停止の時間を自動交換可能時間帯として設定されている場合には、かかる時間帯であるか否かを調べる。
そして、交換タイミング条件が成立すると(ステップS25にて肯定判断)、交換が必要と判断された物理ディスク21内のデータをスペア物理ディスク22にコピーし、当該スペア物理ディスク22を物理ディスク21と交換してRAIDを構成するよう設定し、ディスク交換処理を実行する(ステップS26)。なお、交換タイミング条件が成立していない場合(ステップS25にて否定判断)、例えば、業務停止時間でない場合には、ステップS21に戻り、上述同様の処理が繰り返される。このとき、性能劣化イベントが発生しなくても(ステップS23にて否定判断)、常に交換必要ディスクがあるかどうか調べられ(ステップS21)、交換ディスクが存在するため(ステップS21にて肯定判断)、交換タイミングとなるか否かが常に監視されることとなる(ステップS22)。そして、交換タイミングとなると(ステップS22にて肯定判断)、上述したようにディスク交換処理が実行される(ステップS26)。
以上より、上記構成のディスクアレイ装置によると、特定の物理ディスクの性能劣化を、他の物理ディスクの性能と比較することで検出するため、絶対値との比較により劣化を判断する従来例とは異なり、ディスクの種類や負荷状況に依存することなく、高精度に性能劣化を検出することができる。特に、応答時間の平均値を比較対象とすることで、標準的な応答時間との対比のもとで性能劣化判断を行うことができ、より高精度に性能劣化判断を行うことができる。
そして、性能劣化の検出に応じて、物理ディスクに障害が発生する前に当該ディスクの交換などの対応を採ることができ、あるいは、性能劣化の物理ディスクが自動的に交換されるため、物理ディスクに依存する全ての性能劣化により生じうるディスクアレイ装置の障害を未然に防ぐことができる。
本発明をディスクアレイ装置に組み込むことにより、当該ディスクアレイ装置に生じうる障害を未然に防止することができるため、当該装置の信頼性も向上し、産業上の利用可能性を有する。
ディスクアレイ装置の構成を示すブロック図である。 プロセッサの構成を示す機能ブロック図である。 ディスクアレイ装置の動作を示すフローチャートである。 ディスクアレイ装置の動作を示すフローチャートである。
符号の説明
1 ディスクアレイ装置
2 ホストコンピュータ
10 コントローラ
20 物理ディスクグループ
21 物理ディスク
22 スペア物理ディスク
100 プロセッサ
101 IO処理部
102 応答時間測定部
103 性能劣化判断処理部
104 イベント処理部
105 ディスク交換処理部
110 イベントログ

Claims (12)

  1. 複数の物理ディスクを装備したディスクアレイ装置であって、
    前記各物理ディスクへのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段と、
    前記各物理ディスクの応答時間と、前記複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する性能劣化判断手段と、
    を備えたことを特徴とするディスクアレイ装置。
  2. 前記性能劣化判断手段は、前記各物理ディスクの応答時間の平均値を算出すると共に、この平均値と前記特定の物理ディスクの応答時間とを比較して、当該特定の物理ディスクの性能劣化を判断する、ことを特徴とする請求項1記載のディスクアレイ装置。
  3. 前記性能劣化判断手段は、前記応答時間の平均値を算出する際に、前記特定の物理ディスクを除いた他の前記物理ディスクの応答時間の平均値を算出する、ことを特徴とする請求項2記載のディスクアレイ装置。
  4. 前記性能劣化判断手段は、前記各物理ディスクの応答時間の平均値と、前記特定の物理ディスクの応答時間との比に基づいて、当該特定の物理ディスクの性能劣化を判断する、ことを特徴とする請求項2又は3記載のディスクアレイ装置。
  5. 前記性能劣化判断手段は、前記各物理ディスクの応答時間の平均値と前記特定の物理ディスクの応答時間との比と、予め設定された基準比とを比較して、その比較結果に基づいて前記特定の物理ディスクの性能劣化を判断する、ことを特徴とする請求項4記載のディスクアレイ装置。
  6. 前記性能劣化判断手段は、前記特定の物理ディスクの応答時間Tの前記各物理ディスクの応答時間の平均値Taに対する比(T/Ta)と、予め設定された基準比とを比較して、当該基準比よりも前記比(T/Ta)が高い場合に前記特定の物理ディスクの性能が劣化したと判断する、ことを特徴とする請求項4記載のディスクアレイ装置。
  7. 前記基準比は2である、ことを特徴とする請求項6記載のディスクアレイ装置。
  8. アクセス対象となる前記各物理ディスクのほかに少なくとも1つの予備物理ディスクを備えると共に、
    前記性能劣化判断手段にて、前記特定の物理ディスクの性能が劣化していると判断されたときに、当該特定の物理ディスクに換えて前記予備物理ディスクを使用可能なよう交換処理を行うディスク交換手段を備えた、ことを特徴とする請求項1,2,3,4,5,6又は7記載のディスクアレイ装置。
  9. 複数の物理ディスクを装備したディスクアレイ装置の動作を制御する制御部に、
    前記各物理ディスクへのアクセスに対する応答時間をそれぞれ計測する応答時間計測手段と、
    前記各物理ディスクの応答時間と、前記複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する性能劣化判断手段と、
    を実現するためのディスクアレイ装置の制御プログラム。
  10. 前記性能劣化判断手段は、前記各物理ディスクの応答時間の平均値を算出すると共に、この平均値と前記特定の物理ディスクの応答時間とを比較して、当該特定の物理ディスクの性能劣化を判断する、
    ことを特徴とする請求項9記載のディスクアレイ装置の制御プログラム。
  11. ディスクアレイ装置に装備された複数の物理ディスクへのアクセスに対する応答時間をそれぞれ計測し、
    前記各物理ディスクの応答時間と前記複数の物理ディスクのうち特定の物理ディスクの応答時間とに基づいて、当該特定の物理ディスクの性能劣化を判断する、
    ことを特徴とするディスクアレイ装置の制御方法。
  12. 前記特定の物理ディスクの性能劣化判断を、前記各物理ディスクの応答時間の平均値を算出し、この平均値と前記特定の物理ディスクの応答時間とを比較して行う、ことを特徴とする請求項11記載のディスクアレイ装置の制御方法。
JP2004274469A 2004-09-22 2004-09-22 ディスクアレイ装置及びその制御方法並びに制御プログラム Pending JP2006092070A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2004274469A JP2006092070A (ja) 2004-09-22 2004-09-22 ディスクアレイ装置及びその制御方法並びに制御プログラム
US11/230,534 US20060069866A1 (en) 2004-09-22 2005-09-21 Disk array apparatus, disk array control method and computer program product therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004274469A JP2006092070A (ja) 2004-09-22 2004-09-22 ディスクアレイ装置及びその制御方法並びに制御プログラム

Publications (1)

Publication Number Publication Date
JP2006092070A true JP2006092070A (ja) 2006-04-06

Family

ID=36100556

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004274469A Pending JP2006092070A (ja) 2004-09-22 2004-09-22 ディスクアレイ装置及びその制御方法並びに制御プログラム

Country Status (2)

Country Link
US (1) US20060069866A1 (ja)
JP (1) JP2006092070A (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113383A (ja) * 2008-11-04 2010-05-20 Nec Corp ストレージシステム、その性能判定方法、ディスクアレイ制御部
JP2010224954A (ja) * 2009-03-24 2010-10-07 Toshiba Corp ストレージ装置及び論理ディスク管理方法
US7925926B2 (en) 2007-09-28 2011-04-12 Fujitsu Limited Disk array apparatus, computer-readable recording medium having disk array apparatus control program recorded thereon, and disk array apparatus control method
JP2012178017A (ja) * 2011-02-25 2012-09-13 Nec Corp 記録媒体制御システム、記録媒体制御方法、記録媒体制御プログラム
JP2013084275A (ja) * 2006-11-24 2013-05-09 Sandforce Inc メモリの寿命を縮める動作を遅延させるシステム、方法、及びコンピュータプログラム製品
JP2017167729A (ja) * 2016-03-15 2017-09-21 日本電気株式会社 監視装置、監視方法および監視プログラム
US10725665B2 (en) 2017-04-28 2020-07-28 Fujitsu Limited Storage controlling apparatus, recording medium for recording storage control program and storage controlling method

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8549236B2 (en) * 2006-12-15 2013-10-01 Siliconsystems, Inc. Storage subsystem with multiple non-volatile memory arrays to protect against data losses
US8495295B2 (en) * 2009-05-10 2013-07-23 Infinidat Ltd. Mass storage system and method of operating thereof
WO2011042939A1 (en) * 2009-10-09 2011-04-14 Hitachi, Ltd. Storage control device building a logical unit based on storage devices coupled with different switches
JP6051617B2 (ja) * 2012-06-28 2016-12-27 富士通株式会社 制御装置、ストレージ装置、制御方法及び制御プログラム
CN106407051B (zh) * 2015-07-31 2019-01-11 华为技术有限公司 一种检测慢盘的方法及装置
US10545674B1 (en) * 2016-06-30 2020-01-28 EMS EP Holding Company LLC Method and system for SSD performance jitter detection and avoidance
CN119201006B (zh) * 2024-11-25 2025-02-28 柏科数据技术(深圳)股份有限公司 一种磁盘阵列的性能优化方法、系统、终端及介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4547170B2 (ja) * 2004-03-08 2010-09-22 株式会社日立製作所 ディスクアレイ装置およびその制御方法

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013084275A (ja) * 2006-11-24 2013-05-09 Sandforce Inc メモリの寿命を縮める動作を遅延させるシステム、方法、及びコンピュータプログラム製品
US7925926B2 (en) 2007-09-28 2011-04-12 Fujitsu Limited Disk array apparatus, computer-readable recording medium having disk array apparatus control program recorded thereon, and disk array apparatus control method
JP2010113383A (ja) * 2008-11-04 2010-05-20 Nec Corp ストレージシステム、その性能判定方法、ディスクアレイ制御部
JP2010224954A (ja) * 2009-03-24 2010-10-07 Toshiba Corp ストレージ装置及び論理ディスク管理方法
JP2012178017A (ja) * 2011-02-25 2012-09-13 Nec Corp 記録媒体制御システム、記録媒体制御方法、記録媒体制御プログラム
JP2017167729A (ja) * 2016-03-15 2017-09-21 日本電気株式会社 監視装置、監視方法および監視プログラム
US10725665B2 (en) 2017-04-28 2020-07-28 Fujitsu Limited Storage controlling apparatus, recording medium for recording storage control program and storage controlling method

Also Published As

Publication number Publication date
US20060069866A1 (en) 2006-03-30

Similar Documents

Publication Publication Date Title
CN102279775B (zh) 一种Linux系统下的硬盘故障处理方法
US7738366B2 (en) Methods and structure for detecting SAS link errors with minimal impact on SAS initiator and link bandwidth
JP2006092070A (ja) ディスクアレイ装置及びその制御方法並びに制御プログラム
US8930750B2 (en) Systems and methods for preventing data loss
US9442816B2 (en) Implementing memory performance management and enhanced memory reliability accounting for thermal conditions
EP2787440B1 (en) Information processing device, program, and method
CN102880522B (zh) 面向硬件故障的系统关键文件故障纠正方法及装置
CN111858240B (zh) 一种分布式存储系统的监控方法、系统、设备以及介质
CN111104293A (zh) 用于支持盘故障预测的方法、设备和计算机程序产品
JP2005322399A (ja) 磁気ディスク記憶装置におけるトラック・データ完全性の維持方法
US20070028041A1 (en) Extended failure analysis in RAID environments
JP2013196274A (ja) マルチノードストレージシステムのノード装置および処理速度管理方法
JP5488709B2 (ja) ストレージ制御装置における基準時間設定方法
US8782465B1 (en) Managing drive problems in data storage systems by tracking overall retry time
WO2019054434A1 (ja) 故障予兆検出装置、故障予兆検出方法、及び、故障予兆検出プログラムが格納された記録媒体
JPWO2014103037A1 (ja) 情報処理装置、情報処理方法、及び情報処理プログラム
JP2004118397A (ja) 磁気ディスク装置の障害発生予測システム
US8661298B2 (en) Controlling nanostore operation based on monitored performance
JP2016126656A (ja) ストレージ制御装置,制御プログラム及び制御方法
JP4627327B2 (ja) 異常判定装置
JP6212947B2 (ja) 情報処理装置、制御装置及び制御プログラム
JP2012038362A (ja) ハードディスク故障予兆検出方法
JP2011068109A (ja) 画像形成装置、画像形成装置の制御方法及びプログラム
US10083072B2 (en) Abnormality handling determination program, method for abnormality handling determination, and administration device
CN109542687B (zh) 一种raid级别转换方法及装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080731

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080902

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081029

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090120

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090319

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20091027