JP2004342168A - Device incorporating a device incorporating a disk-type recording device, control method of disk-type recording device, and computer program - Google Patents
Device incorporating a device incorporating a disk-type recording device, control method of disk-type recording device, and computer program Download PDFInfo
- Publication number
- JP2004342168A JP2004342168A JP2003134914A JP2003134914A JP2004342168A JP 2004342168 A JP2004342168 A JP 2004342168A JP 2003134914 A JP2003134914 A JP 2003134914A JP 2003134914 A JP2003134914 A JP 2003134914A JP 2004342168 A JP2004342168 A JP 2004342168A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- disk
- value
- failure prediction
- type recording
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Signal Processing For Digital Recording And Reproducing (AREA)
- Recording Or Reproducing By Magnetic Means (AREA)
Abstract
【課題】各属性値の推移を関して、属性間の因果関係を特定し障害の原因を推定する。
【解決手段】属性限界値を超過した属性の情報が総通電時間とともに記録されるので、属性限界値を超過した属性が複数存在する場合、各属性限界値超過の時間的な前後関係を把握することができる。HDDの仕様上、寿命を表す勧告属性値の上限超過が先に起こっている場合、障害予測属性の属性限界値超過はHDDの寿命により引き起こされた可能性がある。本発明によれば、障害が予測される状態がHDD仕様上寿命の前後いずれに発生したのかを確認することができる。
【選択図】 図1An object of the present invention is to specify a causal relationship between attributes and estimate a cause of a failure with respect to a transition of each attribute value.
The information on the attribute exceeding the attribute limit value is recorded together with the total energizing time. Therefore, when there are a plurality of attributes exceeding the attribute limit value, the temporal context of each attribute limit value excess is grasped. be able to. In the case where the upper limit of the recommended attribute value indicating the service life exceeds the upper limit of the HDD specification in advance in the specification of the HDD, the possibility that the attribute limit value of the failure prediction attribute may be exceeded may be caused by the service life of the HDD. According to the present invention, it is possible to confirm whether a state in which a failure is predicted occurs before or after the life of the HDD according to the HDD specification.
[Selection diagram] Fig. 1
Description
【0001】
【発明の属する技術分野】
本発明は、ハード・ディスクのようにメディアとしての磁気ディスク上で磁気ヘッドをスキャンさせながらデータの読み書き動作を行なうディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラム、並びにコンピュータ・プログラムに係り、特に、保存された貴重なデータの喪失を未然に防止するために自己監視、障害予測機能を備えたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムに関する。
【0002】
さらに詳しくは、本発明は、複数の属性値について属性限界値を超えたかどうかに応じて障害予測や勧告などを行なうディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムに係り、特に、各属性値の推移を関して、属性間の因果関係を特定し障害の原因を推定するディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムに関する。
【0003】
【従来の技術】
情報処理や情報通信など情報技術の発達とともに、過去において作成・編集した情報についても再利用する必要が生じてきており、このために情報蓄積技術はますます重要となってきている。いままで、磁気テープや磁気ディスクなどさまざまなメディアを利用した情報記録装置が開発され普及している。
【0004】
このうちHDD(Hard Disk Drive)は、磁気記録方式の補助記憶装置である。ドライブ・ユニット内には記録媒体である数枚の磁気メディアが収容され、スピンドル・モータによって高速に回転する。メディアには、ニッケル・リンなどのメッキを施した磁性体が塗布されている。そして、磁気ヘッドを回転するメディア表面上で半径方向にスキャンさせることによって、メディア上にデータに相当する磁化を生じさせて書き込みを行ない、あるいはデータを読み出すことができる。
【0005】
ハード・ディスクは既に広汎に普及している。例えば、パーソナル・コンピュータ用の標準的な外部記憶装置として、コンピュータを起動するために必要なオペレーティング・システム(OS)やアプリケーションなど、さまざまなソフトウェアをインストールしたり、作成・編集したファイルを保存したりするためにハード・ディスクが利用されている。通常、HDDは、IDE(Integrated Drive Electronics)やSCSI(Small Computer System Interface)などの標準的なインターフェースを介してコンピュータ本体に接続され、その記憶空間は、FAT(File Allocation Table)などの、オペレーティング・システムのサブシステムであるファイル・システムによって管理される。
【0006】
最近では、HDDの大容量化が進んできている。これに伴って、従来のコンピュータ用補助記憶装置としてだけでなく、放送受信されたAVコンテンツを蓄積するハード・ディスク・レコーダなど、適用分野が拡大し、さまざまなコンテンツを記録するために利用され始めている。
【0007】
ところで、HDDは、ヘッドやディスクなどの機械的な駆動部分を複数含むため、半導体メモリなどの他の不揮発性記憶装置に比べて、データ信頼性の面で制限されるというのが現状である。
【0008】
そこで、HDDに故障が発生し、保存された貴重なデータが失われるのを防ぐために、SMART(Self−Monotoring,Analysis and Reporting Technology)という自己監視、障害予測機能がATA(AT Attachment)仕様に準拠したHDDにオプションとして備えられている。
【0009】
SMARTは、障害予測属性と勧告属性の2種類の属性を持ち、障害予測属性は障害を予測する目的で使われ、勧告属性値はHDDの動作時間や通電時間などの使用状況を監視する目的で使われる。そして、これらの属性値のうちいずれかが属性限界値を超えると、例えばHDDを接続するコンピュータ画面などを介してユーザに警告を発するようになっている。ユーザは、SMART機能を用いて障害を予測し、貴重なデータのバックアップをとるなどの対処策を講じることが可能である。
【0010】
しかしながら、従来のSMART機能では、属性値と属性限界値を単に比較するだけであり、各属性値の履歴を残したり、いつ限界値に到達したかなどの時間的な要素は管理したりはしていない。例えば、複数の属性が属性限界値を超えているとき、それらの属性値がいつ属性限界値を超えたのかを表す情報がないため、各属性値の属性限界値超過の前後関係が明らかにならい。このため、ある属性の属性限界値超過がその他の属性の属性限界値超過を引き起こしている場合であっても、その因果関係を特定したり、さらには障害の原因を推定したりすることは不可能である。
【0011】
【発明が解決しようとする課題】
本発明の目的は、保存された貴重なデータの喪失を未然に防止するために自己監視、障害予測機能を備えた、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することにある。
【0012】
本発明のさらなる目的は、複数の属性値について属性限界値を超えたかどうかに応じて障害予測や勧告などを行なうことができる、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することにある。
【0013】
本発明のさらなる目的は、各属性値の推移を関して、属性間の因果関係を特定し障害の原因を推定することができる、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することにある。
【0014】
【課題を解決するための手段及び作用】
本発明は、上記課題を参酌してなされたものであり、その第1の側面は、ディスク上で読み書きヘッドをスキャンさせながらデータの読み書き動作を行なうディスク型記録装置を内蔵する装置であって、
自己監視又は障害予測に関する2以上の属性値を取得する属性値取得手段と、前記の各属性値が属性値毎に設定された属性限界値を超えたかどうかを監視する自己監視・障害予測手段と、
前記自己監視・障害予測手段により属性限界値を超えたことが検出された各属性値を装置総動作時間とともに記録する自己監視・障害予測情報記録手段と、
を具備することを特徴とするディスク型記録装置を内蔵する装置である。
【0015】
ここで、本発明に係るディスク型記録装置を内蔵する装置は、前記自己監視・障害予測情報記録手段により記録されている各属性値を属性限界値超過時の装置総動作時間に基づいて計時的に分析し、装置状態を推定する装置状態推定手段をさらに備えていてもよい。
【0016】
また、前記の属性値のうち1つは当該装置の障害を予測するために用いられる障害予測属性値であり、他の1つは当該装置の寿命を監視するために用いられる勧告属性値である。
【0017】
前記障害予測属性値がその属性限界値を超えたことは当該装置の障害が予測される状態であり、前記勧告属性がその属性限界値を超えたことは当該装置の寿命に到達したことに相当する。
【0018】
そして、前記装置状態推定手段は、前記障害予測属性と前記勧告属性がそれぞれ属性限界値を超えたときの時間的前後関係に基づいて当該装置の状態を推定することができる。
【0019】
本発明によれば、属性限界値を超過した属性の情報が、ハード・ディスク総通電時間とともに記録されるので、属性限界値を超過した属性が複数存在する場合、それらの属性限界値超過の時間的な前後関係を把握することができる。
【0020】
例えば点検などの目的で機器を回収して属性値を調査する際、勧告属性値が仕様上の上限を超え、且つ障害予測属性値も属性限界値を超えている状態が考えられる。本発明によれば、属性限界値超過の時間的前後関係が明らかであり、障害が予測される状態がHDDの仕様上の寿命が到来する前に発生したのかその後に発生したのかを確認することが可能である。
【0021】
例えば、勧告属性値の上限超過が先に起こっている場合、障害予測属性の属性限界値超過はHDDの寿命により引き起こされたということを推定することができる。
【0022】
また、本発明の第2の側面は、ディスク上で読み書きヘッドをスキャンさせながらデータの読み書き動作を行なうディスク型記録装置の制御をコンピュータ・システム上で実行するようにコンピュータ可読形式で記述されたコンピュータ・プログラムであって、
自己監視又は障害予測に関する2以上の属性値を取得する属性値取得ステップと、
前記の各属性値が属性値毎に設定された属性限界値を超えたかどうかを監視する自己監視・障害予測ステップと、
前記自己監視・障害予測ステップにおいて属性限界値を超えたことが検出された各属性値を装置総動作時間とともに記録する自己監視・障害予測情報記録ステップと、
を具備することを特徴とするコンピュータ・プログラムである。
【0023】
本発明の第2の側面に係るコンピュータ・プログラムは、コンピュータ・システム上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータ・プログラムを定義したものである。換言すれば、本発明の第2の側面に係るコンピュータ・プログラムをコンピュータ・システムにインストールすることによって、コンピュータ・システム上では協働的作用が発揮され、本発明の第1の側面に係るディスク型記録装置を内蔵する装置と同様の作用効果を得ることができる。
【0024】
本発明のさらに他の目的、特徴や利点は、後述する本発明の実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。
【0025】
【発明の実施の形態】
以下、図面を参照しながら本発明の実施形態について詳解する。
【0026】
図1には、本発明の一実施形態に係る、HDD内蔵機器の記録装置周辺部のハードウェア構成を模式的に示している。HDD内蔵機器は、例えばパーソナル・コンピュータ、あるいはHDDレコーダのようなAV機器である。
【0027】
CPU(Central Processing Unit)1は、オペレーティング・システムが提供する実行環境下でプログラムを実行することにより、当該機器全体の動作を統括的にコントロールする。本実施形態では、CPU1は、HDD7の操作も行なう。
【0028】
RAM(Random Access Memory)2は、読み書き可能な半導体メモリ装置であり、CPU1が実行するプログラム・コードをロードしたり、実行プログラムの作業データを一時的に格納したりするために使用される。本実施形態では、RAM2は、HDD7から出力される勧告属性や障害予測属性などのSMARTデータを格納するバッファ、並びに属性値回復データを格納するバッファとしても機能する。
【0029】
SMART属性値バッファ3は、SMART属性値データを処理するためにこれを一時的に格納する。また、SMART限界値バッファ4は、SMART属性限界値データを処理するためにこれを一時的に格納する。また、属性値回復バッファ5は、属性近い袋具のデータを処理するためにこれを一時的に格納する。
【0030】
ATAインターフェース6は、CPU1とHDD7を相互接続するためのインターフェースである。
【0031】
HDD7は、磁気記録方式の補助記憶装置であり、画像、映像、音声などのデータ・コンテンツ、あるいはコンピュータ・ファイルなどを蓄積する。
【0032】
本実施形態では、HDD7に故障が発生し、保存された貴重なデータが失われるのを防ぐために、SMART(Self−Monotoring,Analysis and Reporting Technology)機能部8が搭載されている。SMART機能部8は、ATA仕様に準拠したHDD7に内蔵されている自己監視、障害予測機能である。HDD7本体の内部状態を監視し、障害が予測される状態になるとCPU1へ報告する。
【0033】
SMART機能部8は、HDD7の内部状態の情報を表す複数の属性値を備え、動作時に属性値を監視する。本実施形態では、HDD7の内部状態を表す属性値は、障害を予測するために使われる障害予測属性(Pre−failure Attribute)と、HDD7の寿命などを監視する勧告属性(Advisory Attribute)の2種類からなる。
【0034】
障害予測属性の代表的な例として、Read Error Rate(読み取り誤り率)、勧告属性の代表的な例として、Load/Unload Cycle Count(ロード/アンロード周期計数値)などが挙げられる。属性値にはそれぞれID番号が与えられている。属性の種類はHDD7の製造ベンダやモデルによって異なる。それは、障害を予測する上で重要な要因が、HDD7の性能や形態によって異なるためである。
【0035】
障害予測属性には、それぞれ属性限界値が定められていて、属性値が属性限界値を超えると、障害が予測される状態であると判断される。ユーザは、障害予測に応答して、データのバックアップを取るなど、HDD障害によるデータ喪失以前に対応策を取ることが可能になる。
【0036】
ホストとなる装置(CPU1)は、SMART RETURN STATUSコマンドをHDD7へ発行し、いずれかの属性値が属性限界値を超えているか否かをチェックし、超えていれば、障害が予測される状態として判断する。あるいは、SMART READ ATTRIBUTE VALUESコマンドにより得られた各属性値をSMART READ ATTRIBUTE THRESHOLDSコマンドにより得られた対応する属性限界値と比較し、超えているものがあれば、障害が予測される状態として判断する。SMARTはその他の機能として、数種類の自己診断テスト機能、エラー・ログ機能を備えている。
【0037】
SMARTログ9は、SMART機能部8が自己診断テスト結果や発生したエラーなどを記録する256セクタ(1セクタは512バイト)の不揮発性記憶領域である。SMARTログ9の一部はHDD7のホストとなる機器(AV機器)が、目的に応じて使用可能なHost Vendor Specific領域10として割り当てられている。この領域のサイズは32セクタである。
【0038】
Host Vendor Specific領域10は、SMARTログ9の内部に割り当てられた、ホストが目的に応じて自由に使用可能なログ領域であり、そのサイズは32セクタである。本実施形態では、属性限界値を超過したSMART属性値情報、並びに超過した時点でのハード・ディスク総通電時間情報を、Host Vendor Specific領域10に記録する。
【0039】
図2には、Host Vendor Specific領域10の構成を模式的に示している。
【0040】
障害予測属性ログ11は、障害予測属性値の属性限界値との比較結果が超過状態である場合、その属性の512バイトのSMARTデータを記録するログである。HDDの持つ障害予測属性値の種類は一定ではないので、図2中の障害予測属性値の個数mは一定ではない。限界値超過属性値のSMARTデータの先頭バイトは記録される属性値のID番号に書き換えられて、ログに記録される。
【0041】
勧告属性ログ12は、勧告属性値の属性限界値又はHDD7の仕様上の寿命との比較結果が超過状態である場合、その属性の512バイトのSMARTデータを記録するログである。勧告属性値の種類は一定ではないので、図3中の勧告属性値の個数nは一定ではない。限界値超過属性値のSMARTデータの先頭バイトは記録される属性値のID番号に書き換えられて、ログに記録される。
【0042】
属性値回復ログ13は、以前属性限界値を超えたが、再び正常値に戻った属性値に関する情報を記録する。一度は属性限界値を超過した属性が、再び正常値に戻ることがある(ドライブ温度などが例として挙げられる。温度が極端に上昇し限界値を一旦超えても、冷却を行なうと、再び正常値に戻る。しかし、過去にいつ限界値を超えたのか重要な情報となり得る)。障害予測属性ログ10と勧告属性ログ12は、障害予測データの調査を行なう時点で限界値を超えている属性についての情報を記録するためのものなので、属性限界値を超過した属性が、再び正常値に戻った場合、その属性のログ・データは消去する。しかし、その属性が以前いつ属性限界値を超え、どのような属性値を持ち、いつ正常値に再び戻ったのかを記録する必要があるので、属性値回復ログ12を用いて、それらの情報を記録する。
【0043】
図3には、Host Vendor Specific領域10内の属性値回復ログ12の内部構成を示している。
【0044】
リカバー・カウント13は、属性値が限界値超過状態から正常値への回復が発生した回数を数える。
【0045】
属性値IDは、正常値への回復が発生した属性のID番号を記録する。
【0046】
属性限界値超過時間は、正常値への回復が発生した属性が限界値を超過した時点のHDD総通電時間を記録する。
【0047】
超過時属性値は、正常値へ回復した属性が限界値超過状態だったときの属性値を記録する。
【0048】
属性値回復時間は、正常値へ回復が発生した時点のHDD総通電時間を記録する。
【0049】
次いで、本実施形態に係るHDD内蔵機器において行なわれるHDDの自己監視・障害予測の処理動作について説明する。
【0050】
SMART機能部8の操作は、CPU1からATAインターフェース6経由でHDD7に対して発行されるコマンドにより起動される。SMARTの属性値情報を記録するために、SMARTログ9を使用する。SMARTログ9のサイズは256セクタ(1セクタは512バイト)で、その一部(32セクタ)はホスト側が自由に読み書きできるように構成されている(Host Vendor Specific領域10)。
【0051】
SMARTログ9のHost Vendor Specific領域10は図2に示したように分割され、分割後の各セクタは各SMART属性に対応する。初期状態ではすべてのデータがゼロになる。SMART READ ATTRIBUTE VALUESコマンドを発行することにより、512バイト(HDD1セクタ分のデータ量)の属性値情報がRAM2内のSMART属性値バッファ3内に取り込まれる。512バイトの属性値情報内にはすべての属性の情報が含まれる。同様に、SMART READ ATTRIBUTE THRESHOLDSコマンドを発行することにより、512バイトの属性限界値情報がSMART限界値バッファ4に取り込まれる。
【0052】
各障害予測属性の属性値と属性限界値を1つずつ比較し、ある障害予測属性値が属性限界値を超えた場合、その障害予測属性値に対して初回のみ512バイトの属性値情報を該当する障害予測属性ログ・セクタ11へSMART WRITE LOG SECTORコマンドを用いて記録する。障害予測属性値が1つでも属性限界値を超えると、障害が予測される状態を意味するので、その旨をユーザへ伝えるために警告フラグをセットする。
【0053】
512バイトの属性値情報内にはHDD7の総通電時間が含まれているので、後にSMARTログ9を参照することにより、障害予測属性値がいつ属性限界値を超えたのかを確認することが可能になる。
【0054】
勧告属性の中で、HDD7の寿命到達を知る上で重要と思われる勧告属性値を選択する。そして、勧告属性値を属性限界値と比較するのだが、勧告属性の中には属性限界値を持たないものが存在する場合がある。そのような場合にはHDD7の仕様で明らかになっている製品寿命(Product Life、ロード/アンロード回数の上限など)の情報を用いて属性限界値とする。
【0055】
上記の手法で得られた属性限界値と勧告属性値を1つずつ比較し、ある勧告属性値が限界値を超えた場合、その勧告属性値に対して初回のみ512バイトの属性値情報を該当する勧告属性ログ・セクタ12へSMART WRITE LOG SECTORコマンドを用いて記録する。
【0056】
勧告属性値が1つでも仕様上の寿命を超えると、HDDの寿命に至ったことを意味するので、その旨をユーザへ伝えるための警告フラグをセットする。512バイトの属性値情報内にはHDDの総通電時間が含まれているので、後にSMARTログ9を参照することにより、寿命と障害予測属性の時間的前後関係を調査することが可能になる。
【0057】
HDDによっては、勧告属性値の1つとしてディスク軸ズレ属性を持つものもある。ディスク軸ズレ属性値は、HDD本体に加わった衝撃などにより発生するディスク軸のズレに比例して増加するので、衝撃の有無、程度を調べる有効な手段となる。ディスク軸ズレ属性値は、属性限界値を持たないので、あらかじめ実験用HDDを用いて落下実験などを行ない、衝撃とディスク軸ズレ属性値の関係を調査し、衝撃の強度に合わせて段階的に限界値を設定する。
【0058】
ディスク軸ズレ属性値を各限界値と比較し、限界値を超えている場合、512バイトの属性値情報を該当する勧告属性ログ・セクタ12へSMART WRITE LOG SECTORコマンドを用いて記録する。ディスク軸ズレは段階的に調べるので、数セクタの勧告属性ログ・セクタを用意する必要がある。HDD総通電時間とディスク軸ズレ属性値を衝撃の強度別に記録することにより、どの程度の衝撃がいつHDD7に加わったのかを調査し、衝撃と障害予測属性値の時間的前後関係を調べることが可能になる。
【0059】
Load/Unload Cycle Countなどの属性値は、一度限界値を超過すると2度と正常値には戻らないが、ドライブ温度などの属性は限界値を超えた後、再び正常に戻る可能性がある。このような場合には、障害予測属性ログ・セクタ又は勧告属性ログ・セクタをクリアする必要がある。しかし、限界値を超えた事実は記録として残しておく必要があるので、属性値回復ログ13を用いる。属性値回復ログ13の構成は図3に示した通りである。
【0060】
属性値回復バッファ5へ属性値回復ログ13の情報を読み込み、リカバー・カウント14を更新し、リカバー・カウント14が示す属性回復バッファ5の位置に回復した属性のID、限界値超過が確認された時間、限界値超過時の属性値、限界値超過状態からの回復が確認された時間を記録し、属性値回復ログ13へ書き込む。属性値回復ログ13のサイズは512バイトなので、属性値回復の回数が64回以上になると、再び先頭ブロックから書き込む。
【0061】
図4及び図5には、本実施形態に係るHDD内蔵機器において行なわれるHDDの自己監視・障害予測の処理手順をフローチャートの形式で示している。
【0062】
処理A)処理に使われるSMART属性値バッファ3、SMART限界値バッファ4を初期化する。属性値回復バッファ5へ属性値回復ログ13のデータを読み込む。また、警告用に使われるフラグ(Pre Failure、Advisory Flag)をクリアし、属性値のインデックスを初期化する(i=0、j=0)。
【0063】
処理B)HDD7に対しSMART READ ATTRIBUTE VALUESコマンドとSMART READ ATTRIBUTE THRESHOLDSコマンドを発行し、SMART属性値バッファ3に512バイトのSMART属性値情報を、SMART限界値バッファ4に512バイトのSMART属性限界値情報を格納する。
【0064】
処理C)障害予測属性値iを属性限界値iと比較する。障害予測属性値iが属性限界値iより大きい場合、処理Dに進む。そうでない場合、処理Gへ移る。
【0065】
処理D)障害予測状態を表すフラグをセットする。
【0066】
処理E)障害予想属性ログiが空かどうかをチェックする。空である場合、障害予測属性が属性限界値を正常状態から初めて超えることを表し、属性値情報をログへ書き込む必要があるので処理Fへ進む。そうでない場合、ログは上書きしないので、処理Jへ移る。
【0067】
処理F)SMART属性値バッファ3内のSMART属性情報の先頭バイトを障害予測属性値iのIDに書き換え、SMART WRITE LOG SECTORコマンドにより、障害予想属性ログiへ書き込む。
【0068】
処理G)障害予測属性ログiにデータが存在するかどうかをチェックする。データが存在する場合は処理Hへ進み、存在しない場合は処理Jへ移る。
【0069】
処理H)障害予測属性値が正常値範囲に戻ったため、障害予測属性ログiをクリアする。
【0070】
処理I)属性値が過去に限界値を超えたため、属性値回復バッファ5を更新する。
【0071】
処理J)iをインクリメントし、iが最大値imaxに到達したかどうかをチェックする。すなわち、すべての障害予測属性が比較されたかを調べ、比較が完了している場合は処理Kへ進み、そうでない場合は処理Cへ移る。
【0072】
処理K)勧告属性値jを属性限界値j又は仕様上の寿命jと比較する。勧告属性値jが仕様上の寿命jより大きい場合には処理Lに進み、そうでない場合は処理Rへ移る。
【0073】
処理L)仕様上の寿命到達を表すフラグをセットする。
【0074】
処理M)勧告属性ログjが空かどうかをチェックする。空である場合には、勧告予測属性が仕様上の寿命を正常状態から初めて超えることを表し、属性値情報をログへ書き込む必要があるので、処理Nへ進む。そうでない場合、ログは上書きしないので、障害予測処理を完了する。
【0075】
処理N)SMART属性値バッファ3内のSMART属性情報の先頭バイトを勧告属性値jのIDに書き換え、SMART WRITE LOG SECTORコマンドにより、勧告属性ログjへ書き込む。
【0076】
処理O)勧告属性ログiにデータが存在するかどうかをチェックする。データが存在する場合に処理Pへ進み、存在しない場合には処理Rへ移る。
【0077】
処理P)勧告属性値が正常値範囲に戻ったため、勧告属性ログjをクリアする。
【0078】
処理Q)属性値が過去に限界値を超えたため、属性値回復バッファ5をアップデートする。
【0079】
処理R)jをインクリメントし、jが最大値jmaxに到達したかどうかをチェックする。すべての勧告属性が比較されたかを調べる。比較が完了している場合には障害予測処理を終了し、完了していない場合には処理Kへ移る。
【0080】
処理S)アップデートされた属性値回復バッファ5のデータを属性値回復ログ13に書き込む。
【0081】
[追補]
以上、特定の実施形態を参照しながら、本発明について詳解してきた。しかしながら、本発明の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。すなわち、例示という形態で本発明を開示してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本発明の要旨を判断するためには、冒頭に記載した特許請求の範囲の欄を参酌すべきである。
【0082】
【発明の効果】
以上詳記したように、本発明によれば、保存された貴重なデータの喪失を未然に防止するために自己監視、障害予測機能を備えた、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することができる。
【0083】
また、本発明によれば、複数の属性値について属性限界値を超えたかどうかに応じて障害予測や勧告などを行なうことができる、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することができる。
【0084】
また、本発明によれば、各属性値の推移を関して、属性間の因果関係を特定し障害の原因を推定することができる、優れたディスク型記録装置を内蔵する装置及びディスク型記録装置の制御方法、並びにコンピュータ・プログラムを提供することができる。
【0085】
本発明によれば、属性限界値を超過した属性の情報が、ハード・ディスク総通電時間とともに記録されるので、属性限界値を超過した属性が複数存在する場合、それらの属性限界値超過の時間的な前後関係を把握することができる。
【0086】
HDDを用いたAV機器がサービス、点検などの目的で回収された場合、SMART情報はそのHDDの状態を知る上で重要な役割を果たす。しかし、属性値情報の経時的な記録がない場合、状態分析が困難になる状況が考えられる。回収後、属性値を調査する際に、勧告属性値が仕様上の上限を超え、且つ障害予測属性値も属性限界値を超えている状態が考えられる。HDDの仕様上、寿命を表す勧告属性値の上限超過が先に起こっている場合、障害予測属性の属性限界値超過はHDDの寿命により引き起こされた可能性が考えられる。従来の方法では、属性限界値超過の時間的前後関係が明らかでないので、こういった判断は下せない。これに対し、本発明によれば、障害が予測される状態がHDDの仕様上の寿命が到来する前に発生したのかあるいはその後に発生したのかを確認することが可能である。
【0087】
また、ディスク軸ズレ属性が勧告属性に含まれている場合、HDDに対する外部からの衝撃を監視することが可能になる。ディスク軸ズレが外部からの衝撃により生じた場合、その影響により、障害予測属性の属性限界値超過が発生する場合も考えられる。本発明の方法で属性値情報の記録を参照すれば、ディスク軸ズレの発生と障害予測属性限界値超過の時間的前後関係を知ることが可能になる。ユーザが機器を取り扱う過程で発生した衝撃の記録を取ることが可能になり、この情報をアフターサービスなどで有効に使うことが可能である。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る、HDD内蔵機器の記録装置周辺部のハードウェア構成を模式的に示した図である。
【図2】Host Vendor Specific領域10の構成を模式的に示した図である。
【図3】Host Vendor Specific領域10内の属性値回復ログ12の内部構成を示した図である。
【図4】本実施形態に係るHDD内蔵機器において行なわれるHDDの自己監視・障害予測の処理手順を示したフローチャートである。
【図5】本実施形態に係るHDD内蔵機器において行なわれるHDDの自己監視・障害予測の処理手順を示したフローチャートである。
【符号の説明】
1…CPU
2…RAM
3…SMART属性値バッファ
4…SMART属性限界値バッファ
5…属性値回復バッファ
6…ATAインターフェース
7…HDD
8…SMART機能部
9…SMARTログ
10…Host Vendor Specific領域
11…障害予測属性ログ
12…勧告属性ログ
13…属性値回復ログ[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a device incorporating a disk-type recording device that performs a data read / write operation while scanning a magnetic head on a magnetic disk such as a hard disk as a medium, a method of controlling the disk-type recording device, and a computer program In particular, the present invention relates to an apparatus having a built-in disk type recording apparatus having a self-monitoring function and a failure prediction function in order to prevent the loss of precious stored data, and a method of controlling the disk type recording apparatus. , As well as computer programs.
[0002]
More specifically, the present invention relates to a device incorporating a disk-type recording device that performs a failure prediction and a recommendation according to whether or not a plurality of attribute values exceed an attribute limit value, a method of controlling the disk-type recording device, and The present invention relates to a program, in particular, a device having a built-in disk-type recording device for specifying a causal relationship between attributes and estimating a cause of a failure, and a control method of the disk-type recording device, and a computer program. About.
[0003]
[Prior art]
With the development of information technology such as information processing and information communication, it has become necessary to reuse information created and edited in the past. For this reason, information storage technology has become increasingly important. Until now, information recording devices using various media such as magnetic tapes and magnetic disks have been developed and spread.
[0004]
Among them, an HDD (Hard Disk Drive) is an auxiliary storage device of a magnetic recording system. Several magnetic media, which are recording media, are accommodated in the drive unit, and are rotated at high speed by a spindle motor. The media is coated with a plated magnetic material such as nickel and phosphorus. Then, by scanning the magnetic head in the radial direction on the surface of the rotating medium, magnetization corresponding to data is generated on the medium, and writing or reading can be performed.
[0005]
Hard disks are already widespread. For example, as a standard external storage device for a personal computer, various software such as an operating system (OS) and an application necessary for starting the computer are installed, and files created and edited are stored. Hard disks are used to do this. Usually, the HDD is connected to the computer via a standard interface such as IDE (Integrated Drive Electronics) or SCSI (Small Computer System Interface), and its storage space is provided by an operating system such as FAT (File Allocation Table). Managed by the file system, a subsystem of the system.
[0006]
Recently, the capacity of HDDs has been increasing. Along with this, the field of application is expanding not only as a conventional auxiliary storage device for a computer but also as a hard disk recorder for storing broadcast-received AV contents, and it has begun to be used for recording various contents. I have.
[0007]
By the way, since the HDD includes a plurality of mechanical driving parts such as a head and a disk, it is presently limited in data reliability as compared with other nonvolatile storage devices such as a semiconductor memory.
[0008]
Therefore, in order to prevent the occurrence of a failure in the HDD and the loss of stored valuable data, the self-monitoring and failure prediction functions called SMART (Self-Motoring, Analysis and Reporting Technology) conform to the ATA (AT Attachment) specification. HDD is provided as an option.
[0009]
The SMART has two types of attributes, a failure prediction attribute and a recommendation attribute. The failure prediction attribute is used for predicting a failure, and the recommendation attribute value is used for monitoring a usage state such as an operation time and a power-on time of the HDD. used. When any of these attribute values exceeds the attribute limit value, a warning is issued to the user via, for example, a computer screen to which the HDD is connected. The user can use the SMART function to predict a failure and take measures such as backing up valuable data.
[0010]
However, the conventional SMART function simply compares the attribute value with the attribute limit value, but does not keep a history of each attribute value and manages the temporal elements such as when the limit value is reached. Not. For example, when multiple attributes exceed the attribute limit, there is no information indicating when those attribute values have exceeded the attribute limit. . For this reason, even if exceeding the attribute limit value of one attribute causes exceeding the attribute limit value of another attribute, it is not possible to identify the causal relationship or estimate the cause of the failure. It is possible.
[0011]
[Problems to be solved by the invention]
An object of the present invention is to provide a self-monitoring and failure prediction function for preventing loss of stored precious data beforehand, a device incorporating a superior disk type recording device, and a method of controlling the disk type recording device, And to provide a computer program.
[0012]
A further object of the present invention is to provide a device incorporating a superior disk-type recording device and a control of the disk-type recording device, which can make a failure prediction or a recommendation depending on whether or not a plurality of attribute values exceed an attribute limit value. It is to provide a method, as well as a computer program.
[0013]
A further object of the present invention is to provide a device incorporating a superior disk-type recording device and a disk-type recording device capable of identifying a causal relationship between attributes and estimating a cause of a failure with respect to a transition of each attribute value. A control method and a computer program are provided.
[0014]
Means and Action for Solving the Problems
The present invention has been made in view of the above problems, and a first aspect of the present invention is an apparatus having a built-in disk type recording device that performs a data read / write operation while scanning a read / write head on a disk,
Attribute value acquiring means for acquiring two or more attribute values relating to self-monitoring or fault prediction; self-monitoring / failure predicting means for monitoring whether each of the attribute values exceeds an attribute limit value set for each attribute value; ,
Self-monitoring / failure prediction information recording means for recording each attribute value detected as exceeding the attribute limit value by the self-monitoring / failure prediction means together with the apparatus total operation time,
A device incorporating a disk-type recording device characterized by comprising:
[0015]
Here, the device incorporating the disk-type recording device according to the present invention measures each attribute value recorded by the self-monitoring / failure prediction information recording means based on the total operation time of the device when the attribute limit value is exceeded. And an apparatus state estimating means for estimating the apparatus state.
[0016]
One of the attribute values is a failure prediction attribute value used to predict a failure of the device, and the other is a recommended attribute value used to monitor the life of the device. .
[0017]
The fact that the failure prediction attribute value exceeds the attribute limit value is a state in which a failure of the device is predicted, and the fact that the recommended attribute exceeds the attribute limit value corresponds to the end of the life of the device. I do.
[0018]
Then, the device state estimating means can estimate the state of the device based on the temporal context when the failure prediction attribute and the recommendation attribute each exceed an attribute limit value.
[0019]
According to the present invention, the information of the attribute exceeding the attribute limit value is recorded together with the total power-on time of the hard disk. Can be grasped.
[0020]
For example, when the device is collected for inspection or the like and the attribute value is examined, the state where the recommended attribute value exceeds the upper limit in the specification and the failure prediction attribute value also exceeds the attribute limit value may be considered. According to the present invention, the temporal context of exceeding an attribute limit value is clear, and it is confirmed whether a state in which a failure is predicted occurred before the end of the life of the HDD according to the specification or after that. Is possible.
[0021]
For example, if the upper limit of the recommended attribute value is exceeded first, it can be estimated that the attribute limit value excess of the failure prediction attribute is caused by the life of the HDD.
[0022]
According to a second aspect of the present invention, there is provided a computer which is described in a computer readable format so as to execute, on a computer system, a disk type recording apparatus which performs a data read / write operation while scanning a read / write head on a disk. A program,
An attribute value acquiring step of acquiring two or more attribute values relating to self-monitoring or failure prediction;
A self-monitoring / failure prediction step of monitoring whether each of the attribute values exceeds an attribute limit set for each attribute value,
A self-monitoring / failure prediction information recording step of recording each attribute value detected to have exceeded the attribute limit value in the self-monitoring / failure prediction step together with the apparatus total operation time;
A computer program characterized by comprising:
[0023]
The computer program according to the second aspect of the present invention defines a computer program described in a computer-readable format so as to realize a predetermined process on a computer system. In other words, by installing the computer program according to the second aspect of the present invention in a computer system, a cooperative action is exerted on the computer system, and the disk type according to the first aspect of the present invention is realized. The same operation and effect as those of the device incorporating the recording device can be obtained.
[0024]
Further objects, features, and advantages of the present invention will become apparent from more detailed descriptions based on embodiments of the present invention described below and the accompanying drawings.
[0025]
BEST MODE FOR CARRYING OUT THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0026]
FIG. 1 schematically shows a hardware configuration of a peripheral portion of a recording device of a device with a built-in HDD according to an embodiment of the present invention. The HDD built-in device is, for example, an AV device such as a personal computer or an HDD recorder.
[0027]
A CPU (Central Processing Unit) 1 executes a program under an execution environment provided by an operating system, thereby controlling the operation of the entire device as a whole. In the present embodiment, the CPU 1 also operates the HDD 7.
[0028]
A RAM (Random Access Memory) 2 is a readable and writable semiconductor memory device, and is used to load a program code to be executed by the CPU 1 and temporarily store work data of an execution program. In the present embodiment, the RAM 2 also functions as a buffer for storing SMART data such as a recommendation attribute and a failure prediction attribute output from the HDD 7 and a buffer for storing attribute value recovery data.
[0029]
The SMART attribute value buffer 3 temporarily stores the SMART attribute value data for processing. The SMART limit value buffer 4 temporarily stores the SMART attribute limit value data for processing. Further, the attribute value recovery buffer 5 temporarily stores the data of the bag close to the attribute in order to process the data.
[0030]
The ATA interface 6 is an interface for interconnecting the CPU 1 and the HDD 7.
[0031]
The HDD 7 is an auxiliary storage device of a magnetic recording system, and stores data contents such as images, videos and sounds, or computer files.
[0032]
In the present embodiment, a SMART (Self-Motoring, Analysis and Reporting Technology) function unit 8 is mounted to prevent a failure from occurring in the HDD 7 and losing stored precious data. The SMART function unit 8 is a self-monitoring and failure prediction function built in the HDD 7 based on the ATA specification. It monitors the internal state of the HDD 7 and reports to the CPU 1 when a failure is predicted.
[0033]
The SMART function unit 8 has a plurality of attribute values indicating information on the internal state of the HDD 7, and monitors the attribute values during operation. In the present embodiment, there are two types of attribute values representing the internal state of the HDD 7, a failure prediction attribute (Pre-failure Attribute) used for predicting a failure, and a recommendation attribute (Advisory Attribute) for monitoring the life of the HDD 7 and the like. Consists of
[0034]
A typical example of the failure prediction attribute is a Read Error Rate (read error rate), and a typical example of the recommendation attribute is a Load / Unload Cycle Count (load / unload cycle count value). Each attribute value is given an ID number. The type of attribute differs depending on the manufacturer and model of the HDD 7. This is because important factors for predicting a failure vary depending on the performance and form of the HDD 7.
[0035]
An attribute limit value is defined for each failure prediction attribute. If the attribute value exceeds the attribute limit value, it is determined that a failure is predicted. In response to the failure prediction, the user can take countermeasures before data loss due to HDD failure, such as taking a backup of data.
[0036]
The host device (CPU 1) issues a SMART RETURN STATUS command to the HDD 7 and checks whether any attribute value exceeds the attribute limit value. to decide. Alternatively, each attribute value obtained by the SMART READ ATTRIBUTE VALUES command is compared with the corresponding attribute limit value obtained by the SMART READ ATTRIBUTE THRESHOLDS command. . The SMART has several other functions such as a self-diagnosis test function and an error log function.
[0037]
The SMART log 9 is a non-volatile storage area of 256 sectors (one sector is 512 bytes) in which the SMART function unit 8 records a self-diagnosis test result and an error that has occurred. A part of the SMART log 9 is allocated as a Host Vendor Specific area 10 that can be used by a device (AV device) serving as a host of the HDD 7 according to the purpose. The size of this area is 32 sectors.
[0038]
The Host Vendor Specific area 10 is a log area allocated inside the SMART log 9 and freely usable by the host according to the purpose, and has a size of 32 sectors. In the present embodiment, the SMART attribute value information exceeding the attribute limit value and the hard disk total power-on time information at the time when the attribute limit value is exceeded are recorded in the Host Vendor Specific area 10.
[0039]
FIG. 2 schematically shows the configuration of the Host Vendor Specific area 10.
[0040]
The failure prediction attribute log 11 is a log for recording 512-byte SMART data of the attribute when the comparison result of the failure prediction attribute value with the attribute limit value is in an excess state. Since the types of failure prediction attribute values of the HDD are not constant, the number m of failure prediction attribute values in FIG. 2 is not constant. The first byte of the SMART data of the attribute value exceeding the limit value is rewritten with the ID number of the attribute value to be recorded and recorded in the log.
[0041]
The recommendation attribute log 12 is a log for recording 512-byte SMART data of the attribute when the comparison result with the attribute limit value of the recommendation attribute value or the service life in the specification of the HDD 7 is in an excess state. Since the type of the recommended attribute value is not constant, the number n of the recommended attribute values in FIG. 3 is not constant. The first byte of the SMART data of the attribute value exceeding the limit value is rewritten with the ID number of the attribute value to be recorded and recorded in the log.
[0042]
The attribute value recovery log 13 records information on the attribute value that has exceeded the attribute limit value but has returned to the normal value again. An attribute that once exceeded the attribute limit value may return to a normal value again (such as the drive temperature. Even if the temperature rises extremely and exceeds the limit value, once cooling is performed, normality is restored again. Back to the value, but it can be important information when the limit was exceeded in the past). The failure prediction attribute log 10 and the recommendation attribute log 12 are for recording information on attributes exceeding the limit value at the time of examining the failure prediction data. When the value returns, the log data of the attribute is deleted. However, it is necessary to record when the attribute has exceeded the attribute limit value in the past, what attribute value it has, and when it has returned to the normal value again. Record.
[0043]
FIG. 3 shows an internal configuration of the attribute value recovery log 12 in the Host Vendor Specific area 10.
[0044]
The recover count 13 counts the number of times that the attribute value has recovered from the state of exceeding the limit value to the normal value.
[0045]
The attribute value ID records the ID number of the attribute whose recovery to the normal value has occurred.
[0046]
The attribute limit value excess time records the total HDD energization time at the time when the attribute whose recovery to the normal value has occurred exceeds the limit value.
[0047]
The attribute value at the time of excess records the attribute value when the attribute restored to the normal value is in the state of exceeding the limit value.
[0048]
The attribute value recovery time records the total power supply time of the HDD at the time of recovery to the normal value.
[0049]
Next, a description will be given of a processing operation of HDD self-monitoring and failure prediction performed in the HDD built-in device according to the present embodiment.
[0050]
The operation of the SMART function unit 8 is started by a command issued from the CPU 1 to the HDD 7 via the ATA interface 6. The SMART log 9 is used to record SMART attribute value information. The size of the SMART log 9 is 256 sectors (one sector is 512 bytes), and a part (32 sectors) of the SMART log 9 is configured so that the host side can freely read and write (Host Vendor Specific area 10).
[0051]
The Host Vendor Specific area 10 of the SMART log 9 is divided as shown in FIG. 2, and each of the divided sectors corresponds to each SMART attribute. Initially, all data is zero. By issuing the SMART READ ATTRIBUTE VALUES command, 512-byte (data amount for one HDD sector) attribute value information is taken into the SMART attribute value buffer 3 in the RAM 2. All attribute information is included in the 512-byte attribute value information. Similarly, by issuing a SMART READ ATTRIBUTE THRESHOLDS command, 512-byte attribute limit value information is taken into the SMART limit value buffer 4.
[0052]
The attribute value of each failure prediction attribute is compared with the attribute limit value one by one, and when a certain failure prediction attribute value exceeds the attribute limit value, 512 bytes of attribute value information is applied to the failure prediction attribute value only for the first time. Using the SMART WRITE LOG SECTOR command. If at least one of the fault prediction attribute values exceeds the attribute limit value, it means that a fault is predicted, and a warning flag is set to inform the user of that.
[0053]
Since the total energizing time of the HDD 7 is included in the 512-byte attribute value information, it is possible to confirm when the predicted failure attribute value exceeds the attribute limit value by referring to the SMART log 9 later. become.
[0054]
Among the recommendation attributes, a recommendation attribute value considered important for knowing the end of the life of the HDD 7 is selected. Then, the recommended attribute value is compared with the attribute limit value. Some of the recommended attributes do not have the attribute limit value. In such a case, the attribute limit value is set by using information on the product life (product life, the upper limit of the number of times of loading / unloading, etc.) clarified in the specification of the HDD 7.
[0055]
The attribute limit value and the recommended attribute value obtained by the above method are compared one by one, and if a certain recommended attribute value exceeds the limit value, the attribute value information of 512 bytes corresponds to the recommended attribute value only for the first time. The recommended attribute log sector 12 is recorded using the SMART WRITE LOG SECTOR command.
[0056]
If any one of the recommended attribute values exceeds the life of the specification, it means that the life of the HDD has been reached, so a warning flag for notifying the user of the fact is set. Since the total energizing time of the HDD is included in the 512-byte attribute value information, by referring to the SMART log 9 later, it is possible to investigate the temporal relationship between the lifetime and the failure prediction attribute.
[0057]
Some HDDs have a disk axis shift attribute as one of the recommended attribute values. The disc axis deviation attribute value increases in proportion to the disc axis deviation caused by an impact applied to the HDD body or the like, so that it is an effective means for examining the presence / absence of the impact. Since the disc axis deviation attribute value does not have the attribute limit value, a drop test etc. is performed in advance using an experimental HDD, the relationship between the impact and the disc axis deviation attribute value is investigated, and the Set the limit value.
[0058]
The disc axis deviation attribute value is compared with each limit value, and if it exceeds the limit value, 512-byte attribute value information is recorded in the corresponding recommended attribute log sector 12 using the SMART WRITE LOG SECTOR command. Since the disc axis deviation is checked in stages, it is necessary to prepare several recommended attribute log sectors. By recording the total energizing time of the HDD and the disk axis deviation attribute value for each impact intensity, it is possible to investigate how much impact was applied to the HDD 7 and when, and to examine the temporal relationship between the impact and the failure prediction attribute value. Will be possible.
[0059]
Attribute values such as Load / Unload Cycle Count do not return to normal values once they exceed the limit value, but attributes such as drive temperature may return to normal again after exceeding the limit value. In such a case, it is necessary to clear the failure prediction attribute log sector or the recommendation attribute log sector. However, since the fact that the limit value has been exceeded must be recorded, the attribute value recovery log 13 is used. The configuration of the attribute value recovery log 13 is as shown in FIG.
[0060]
The information of the attribute value recovery log 13 is read into the attribute value recovery buffer 5, the recovery count 14 is updated, and the ID of the attribute recovered to the position of the attribute recovery buffer 5 indicated by the recovery count 14 and exceeding the limit value are confirmed. The time, the attribute value when the limit value is exceeded, and the time when the recovery from the limit value excess state is confirmed are recorded and written to the attribute value recovery log 13. Since the size of the attribute value recovery log 13 is 512 bytes, when the number of times of attribute value recovery becomes 64 or more, writing is performed again from the first block.
[0061]
4 and 5 show, in the form of a flowchart, a processing procedure of HDD self-monitoring and failure prediction performed in the HDD built-in device according to the present embodiment.
[0062]
Process A) The SMART attribute value buffer 3 and the SMART limit value buffer 4 used for the process are initialized. The data of the attribute value recovery log 13 is read into the attribute value recovery buffer 5. Also, the flags (Pre Failure, Advisory Flag) used for the warning are cleared, and the index of the attribute value is initialized (i = 0, j = 0).
[0063]
Process B) A SMART READ ATTRIBUTE VALUES command and a SMART READ ATTRIBUTE THRESHOLDS command are issued to the HDD 7, the 512-byte SMART attribute value information is stored in the SMART attribute value buffer 3, and the 512-byte SMART attribute limit value information is stored in the SMART limit value buffer 4. Is stored.
[0064]
Process C) The failure prediction attribute value i is compared with the attribute limit value i. If the failure prediction attribute value i is larger than the attribute limit value i, the process proceeds to processing D. Otherwise, the process proceeds to processing G.
[0065]
Process D) A flag indicating a failure prediction state is set.
[0066]
Process E) Check whether the failure prediction attribute log i is empty. If it is empty, it indicates that the failure prediction attribute exceeds the attribute limit value from the normal state for the first time, and it is necessary to write the attribute value information to the log. Otherwise, the process proceeds to processing J because the log is not overwritten.
[0067]
Process F) The head byte of the SMART attribute information in the SMART attribute value buffer 3 is rewritten to the ID of the failure prediction attribute value i, and is written to the failure prediction attribute log i by the SMART WRITE LOG SECTOR command.
[0068]
Process G) Check whether data exists in the failure prediction attribute log i. If the data exists, the process proceeds to process H, and if not, the process proceeds to process J.
[0069]
Process H) Since the failure prediction attribute value has returned to the normal value range, the failure prediction attribute log i is cleared.
[0070]
Processing I) Since the attribute value has exceeded the limit value in the past, the attribute value recovery buffer 5 is updated.
[0071]
Process J) i is incremented and i is the maximum value i max Check if has been reached. That is, it is checked whether all the failure prediction attributes have been compared. If the comparison has been completed, the process proceeds to process K; otherwise, the process proceeds to process C.
[0072]
Process K) The recommended attribute value j is compared with the attribute limit value j or the specified lifetime j. If the recommended attribute value j is longer than the specified life j, the process proceeds to process L; otherwise, the process proceeds to process R.
[0073]
Process L) A flag indicating the end of the life in the specification is set.
[0074]
Process M) Check whether the recommendation attribute log j is empty. If it is empty, it indicates that the recommended prediction attribute exceeds the lifetime in the specification from the normal state for the first time, and it is necessary to write the attribute value information to the log. Otherwise, since the log is not overwritten, the failure prediction processing is completed.
[0075]
Process N) The head byte of the SMART attribute information in the SMART attribute value buffer 3 is rewritten to the ID of the recommended attribute value j, and is written to the recommended attribute log j by the SMART WRITE LOG SECTOR command.
[0076]
Process O) Check whether data exists in the recommendation attribute log i. If the data exists, the process proceeds to process P, and if not, the process proceeds to process R.
[0077]
Process P) Since the recommendation attribute value has returned to the normal value range, the recommendation attribute log j is cleared.
[0078]
Process Q) Since the attribute value has exceeded the limit value in the past, the attribute value recovery buffer 5 is updated.
[0079]
Process R) j is incremented, and j is the maximum value j max Check if has been reached. Check if all advisory attributes have been compared. If the comparison has been completed, the failure prediction process ends, and if not, the process proceeds to process K.
[0080]
Process S) Write the updated data of the attribute value recovery buffer 5 to the attribute value recovery log 13.
[0081]
[Supplement]
The present invention has been described in detail with reference to the specific embodiments. However, it is obvious that those skilled in the art can modify or substitute the embodiment without departing from the scope of the present invention. That is, the present invention has been disclosed by way of example, and the contents described in this specification should not be interpreted in a limited manner. In order to determine the gist of the present invention, the claims described at the beginning should be considered.
[0082]
【The invention's effect】
As described above in detail, according to the present invention, an apparatus and a disk incorporating a superior disk type recording device having a self-monitoring and failure prediction function in order to prevent the loss of stored valuable data beforehand A method for controlling a pattern recording device and a computer program can be provided.
[0083]
Further, according to the present invention, it is possible to perform a failure prediction, a recommendation, or the like according to whether or not a plurality of attribute values exceed an attribute limit value. A control method and a computer program can be provided.
[0084]
Further, according to the present invention, a device incorporating a superior disk-type recording device and a disk-type recording device capable of identifying a causal relationship between attributes and estimating a cause of a failure with respect to transition of each attribute value And a computer program can be provided.
[0085]
According to the present invention, the information of the attribute exceeding the attribute limit value is recorded together with the total power-on time of the hard disk. Can be grasped.
[0086]
When an AV device using an HDD is collected for the purpose of service or inspection, SMART information plays an important role in knowing the state of the HDD. However, if attribute value information is not recorded over time, there may be situations where state analysis becomes difficult. After collection, when investigating attribute values, it is conceivable that the recommended attribute value exceeds the upper limit in the specification and the failure prediction attribute value also exceeds the attribute limit value. In the case where the upper limit of the recommended attribute value indicating the service life exceeds the upper limit of the HDD specification in advance, it is possible that the attribute limit value of the failure prediction attribute is exceeded due to the service life of the HDD. In the conventional method, such a judgment cannot be made because the temporal context of exceeding the attribute limit value is not clear. On the other hand, according to the present invention, it is possible to confirm whether a state in which a failure is predicted has occurred before the end of the life of the HDD according to the specification or after that.
[0087]
Further, when the disk axis deviation attribute is included in the recommendation attribute, it is possible to monitor an external impact on the HDD. When the disc axis deviation is caused by an external impact, the influence may cause the failure prediction attribute to exceed the attribute limit value. By referring to the recording of the attribute value information by the method of the present invention, it is possible to know the temporal relationship between the occurrence of the disc axis deviation and the exceeding of the fault prediction attribute limit value. It becomes possible for the user to record the impact generated in the process of handling the device, and this information can be used effectively in after-sales service and the like.
[Brief description of the drawings]
FIG. 1 is a diagram schematically illustrating a hardware configuration of a peripheral device of a recording device of a device with a built-in HDD according to an embodiment of the present invention.
FIG. 2 is a diagram schematically showing a configuration of a Host Vendor Specific area 10;
FIG. 3 is a diagram showing an internal configuration of an attribute value recovery log 12 in a Host Vendor Specific area 10;
FIG. 4 is a flowchart showing a processing procedure of HDD self-monitoring and failure prediction performed in the HDD built-in device according to the embodiment.
FIG. 5 is a flowchart showing a procedure of HDD self-monitoring and failure prediction performed in the HDD built-in device according to the embodiment.
[Explanation of symbols]
1 ... CPU
2 ... RAM
3: SMART attribute value buffer
4: SMART attribute limit value buffer
5: Attribute value recovery buffer
6 ... ATA interface
7 ... HDD
8 SMART function section
9 ... SMART log
10: Host Vendor Specific area
11: Failure prediction attribute log
12 ... Recommended attribute log
13: Attribute value recovery log
Claims (13)
前記ディスク型記録装置の自己監視又は障害予測に関する2以上の属性値を取得する属性値取得手段と、
前記の各属性値が属性値毎に設定された属性限界値を超えたかどうかを監視する自己監視・障害予測手段と、
前記自己監視・障害予測手段により属性限界値を超えたことが検出された各属性値を装置総動作時間とともに記録する自己監視・障害予測情報記録手段と、
を具備することを特徴とするディスク型記録装置を内蔵する装置。A device having a built-in disk type recording device that performs a data read / write operation while scanning a read / write head on a disk,
Attribute value acquiring means for acquiring two or more attribute values relating to self-monitoring or failure prediction of the disk-type recording device;
Self-monitoring / failure prediction means for monitoring whether each of the attribute values exceeds an attribute limit set for each attribute value,
Self-monitoring / failure prediction information recording means for recording each attribute value detected as exceeding the attribute limit value by the self-monitoring / failure prediction means together with the apparatus total operation time,
A device having a built-in disk type recording device, comprising:
ことを特徴とする請求項1に記載のディスク型記録装置を内蔵する装置。The apparatus state estimating means for estimating the apparatus state by analyzing two or more attribute values recorded by the self-monitoring / failure prediction information recording means based on the total operation time of the apparatus when the attribute limit value is exceeded is further provided. Prepare,
An apparatus incorporating the disk-type recording apparatus according to claim 1.
前記障害予測属性値がその属性限界値を超えたことは当該装置の障害が予測される状態であり、前記勧告属性がその属性限界値を超えたことは当該装置の寿命に到達したことに相当する、
ことを特徴とする請求項1又は2のいずれかに記載のディスク型記録装置を内蔵する装置。One of the attribute values is a failure prediction attribute value used to predict a failure of the device, the other is a recommended attribute value used to monitor the life of the device,
The fact that the failure prediction attribute value exceeds the attribute limit value is a state in which a failure of the device is predicted, and the fact that the recommended attribute exceeds the attribute limit value corresponds to the end of the life of the device. Do
An apparatus incorporating the disk-type recording apparatus according to claim 1.
ことを特徴とする請求項3に記載のディスク型記録装置を内蔵する装置。The device state estimation unit estimates the state of the device based on the temporal context when the failure prediction attribute and the recommendation attribute each exceed an attribute limit value,
An apparatus incorporating the disk-type recording apparatus according to claim 3.
ことを特徴とする請求項4に記載のディスク型記録装置を内蔵する装置。The device state estimating means estimates that if the recommended attribute value exceeds the upper limit first, the failure prediction attribute exceeds the attribute limit value caused by the life of the device.
An apparatus incorporating the disk-type recording apparatus according to claim 4.
前記属性値取得手段は、前記ディスク型記録装置内でSMART機能により記録される属性値のログ・データを取得する、
ことを特徴とする請求項1に記載のディスク型記録装置を内蔵する装置。The disk-type recording apparatus has a SMART (Self-Motoring, Analysis and Reporting Technology) function,
The attribute value acquiring means acquires log data of an attribute value recorded by a SMART function in the disk-type recording device;
An apparatus incorporating the disk-type recording apparatus according to claim 1.
自己監視又は障害予測に関する2以上の属性値を取得する属性値取得ステップと、
前記の各属性値が属性値毎に設定された属性限界値を超えたかどうかを監視する自己監視・障害予測ステップと、
前記自己監視・障害予測ステップにおいて属性限界値を超えたことが検出された各属性値を装置総動作時間とともに記録する自己監視・障害予測情報記録ステップと、
を具備することを特徴とするディスク型記録装置の制御方法。A method for controlling a disk-type recording device that performs a data read / write operation while scanning a read / write head on a disk,
An attribute value acquiring step of acquiring two or more attribute values relating to self-monitoring or failure prediction;
A self-monitoring / failure prediction step of monitoring whether each of the attribute values exceeds an attribute limit set for each attribute value,
A self-monitoring / failure prediction information recording step of recording each attribute value detected to have exceeded the attribute limit value in the self-monitoring / failure prediction step together with the apparatus total operation time;
A method for controlling a disk-type recording device, comprising:
ことを特徴とする請求項7に記載のディスク型記録装置の制御方法。A device state estimating step of estimating the device state by analyzing two or more attribute values recorded in the self-monitoring / failure prediction information recording step based on the total operation time of the device when the attribute limit value is exceeded. Prepare,
8. The method for controlling a disk-type recording apparatus according to claim 7, wherein:
前記障害予測属性値がその属性限界値を超えたことは当該装置の障害が予測される状態であり、前記勧告属性がその属性限界値を超えたことは当該装置の寿命に到達したことに相当する、
ことを特徴とする請求項7又は8のいずれかに記載のディスク型記録装置の制御方法。One of the attribute values is a failure prediction attribute value used to predict a failure of the device, the other is a recommended attribute value used to monitor the life of the device,
The fact that the failure prediction attribute value exceeds the attribute limit value is a state in which a failure of the device is predicted, and the fact that the recommended attribute exceeds the attribute limit value corresponds to the end of the life of the device. Do
9. The control method for a disk-type recording device according to claim 7, wherein
ことを特徴とする請求項9に記載のディスク型記録装置の制御方法。In the device state estimation step, the state of the device is estimated based on the temporal context when the failure prediction attribute and the recommendation attribute each exceed an attribute limit value,
The method for controlling a disk-type recording apparatus according to claim 9, wherein:
ことを特徴とする請求項10に記載のディスク型記録装置の制御方法。In the device state estimation step, if the upper limit of the recommended attribute value has occurred first, it is estimated that the attribute limit value excess of the failure prediction attribute has been caused by the life of the device,
The method of controlling a disk-type recording device according to claim 10, wherein:
前記属性値取得ステップでは、前記ディスク型記録装置内でSMART機能により記録される属性値のログ・データを取得する、
ことを特徴とする請求項7に記載のディスク型記録装置の制御方法。The disk-type recording apparatus has a SMART (Self-Motoring, Analysis and Reporting Technology) function,
In the attribute value obtaining step, log data of an attribute value recorded by a SMART function in the disk type recording device is obtained.
8. The method for controlling a disk-type recording apparatus according to claim 7, wherein:
自己監視又は障害予測に関する2以上の属性値を取得する属性値取得ステップと、
前記の各属性値が属性値毎に設定された属性限界値を超えたかどうかを監視する自己監視・障害予測ステップと、
前記自己監視・障害予測ステップにおいて属性限界値を超えたことが検出された各属性値を装置総動作時間とともに記録する自己監視・障害予測情報記録ステップと、
を具備することを特徴とするコンピュータ・プログラム。A computer program written in a computer-readable format so as to execute, on a computer system, a disk-type recording device that performs a data read / write operation while scanning a read / write head on a disk,
An attribute value acquiring step of acquiring two or more attribute values relating to self-monitoring or failure prediction;
A self-monitoring / failure prediction step of monitoring whether each of the attribute values exceeds an attribute limit set for each attribute value,
A self-monitoring / failure prediction information recording step of recording each attribute value detected to have exceeded the attribute limit value in the self-monitoring / failure prediction step together with the apparatus total operation time;
A computer program comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003134914A JP4111052B2 (en) | 2003-05-13 | 2003-05-13 | Apparatus incorporating disk type recording apparatus, method for controlling disk type recording apparatus, and computer program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2003134914A JP4111052B2 (en) | 2003-05-13 | 2003-05-13 | Apparatus incorporating disk type recording apparatus, method for controlling disk type recording apparatus, and computer program |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2004342168A true JP2004342168A (en) | 2004-12-02 |
| JP4111052B2 JP4111052B2 (en) | 2008-07-02 |
Family
ID=33525341
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2003134914A Expired - Fee Related JP4111052B2 (en) | 2003-05-13 | 2003-05-13 | Apparatus incorporating disk type recording apparatus, method for controlling disk type recording apparatus, and computer program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP4111052B2 (en) |
Cited By (9)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7477466B2 (en) | 2006-06-15 | 2009-01-13 | Fujitsu Limited | Control device and storage device |
| JP2009140586A (en) * | 2007-12-07 | 2009-06-25 | Toshiba Corp | Information recording apparatus and control method of information recording apparatus |
| US7593176B2 (en) | 2006-06-15 | 2009-09-22 | Fujitsu Limited | Control apparatus and storage device |
| JP2012503836A (en) * | 2008-09-30 | 2012-02-09 | インテル コーポレイション | Method for communicating a time stamp to a storage system |
| CN110109786A (en) * | 2019-04-18 | 2019-08-09 | 东莞记忆存储科技有限公司 | SMART information test method, device, computer equipment and storage medium |
| CN111095146A (en) * | 2017-06-12 | 2020-05-01 | 霍尼韦尔国际公司 | Apparatus and method for automated identification and diagnosis of constraint violations |
| WO2020263335A1 (en) * | 2019-06-26 | 2020-12-30 | Western Digital Technologies, Inc. | Use of error correction-based metric for identifying poorly performing data storage devices |
| JP2021502663A (en) * | 2018-01-31 | 2021-01-28 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | Hard disk drive life prediction |
| JP2021177401A (en) * | 2020-05-18 | 2021-11-11 | キオクシア株式会社 | Information processing device |
-
2003
- 2003-05-13 JP JP2003134914A patent/JP4111052B2/en not_active Expired - Fee Related
Cited By (16)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US7593176B2 (en) | 2006-06-15 | 2009-09-22 | Fujitsu Limited | Control apparatus and storage device |
| US7477466B2 (en) | 2006-06-15 | 2009-01-13 | Fujitsu Limited | Control device and storage device |
| JP2009140586A (en) * | 2007-12-07 | 2009-06-25 | Toshiba Corp | Information recording apparatus and control method of information recording apparatus |
| JP2012503836A (en) * | 2008-09-30 | 2012-02-09 | インテル コーポレイション | Method for communicating a time stamp to a storage system |
| US9727473B2 (en) | 2008-09-30 | 2017-08-08 | Intel Corporation | Methods to communicate a timestamp to a storage system |
| US10261701B2 (en) | 2008-09-30 | 2019-04-16 | Intel Corporation | Methods to communicate a timestamp to a storage system |
| CN111095146A (en) * | 2017-06-12 | 2020-05-01 | 霍尼韦尔国际公司 | Apparatus and method for automated identification and diagnosis of constraint violations |
| JP7043598B2 (en) | 2018-01-31 | 2022-03-29 | ヒューレット-パッカード デベロップメント カンパニー エル.ピー. | Hard disk drive life prediction |
| JP2021502663A (en) * | 2018-01-31 | 2021-01-28 | ヒューレット−パッカード デベロップメント カンパニー エル.ピー.Hewlett‐Packard Development Company, L.P. | Hard disk drive life prediction |
| CN110109786A (en) * | 2019-04-18 | 2019-08-09 | 东莞记忆存储科技有限公司 | SMART information test method, device, computer equipment and storage medium |
| WO2020263335A1 (en) * | 2019-06-26 | 2020-12-30 | Western Digital Technologies, Inc. | Use of error correction-based metric for identifying poorly performing data storage devices |
| US11237893B2 (en) | 2019-06-26 | 2022-02-01 | Western Digital Technologies, Inc. | Use of error correction-based metric for identifying poorly performing data storage devices |
| JP2021177401A (en) * | 2020-05-18 | 2021-11-11 | キオクシア株式会社 | Information processing device |
| JP7143487B2 (en) | 2020-05-18 | 2022-09-28 | キオクシア株式会社 | Information processing equipment |
| JP2022171781A (en) * | 2020-05-18 | 2022-11-11 | キオクシア株式会社 | Information processing equipment |
| JP7362863B2 (en) | 2020-05-18 | 2023-10-17 | キオクシア株式会社 | information processing equipment |
Also Published As
| Publication number | Publication date |
|---|---|
| JP4111052B2 (en) | 2008-07-02 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US5278970A (en) | Method for efficient utilization of removable data recording media | |
| CN100430906C (en) | Library system, virtual library device, and buffer recovery method used in virtual library device | |
| EP1498901A1 (en) | Methods and systems for providing predictive maintenance, preventative maintenance, and/or failure isolation in a tape storage subsystem | |
| US20030016609A1 (en) | Data storage device monitoring system, method and removable data carrier use with data storage systems | |
| JPH1078897A (en) | Computer data storage system | |
| US20100031094A1 (en) | Disk device, circuit board, and error log information recording method | |
| US6125459A (en) | Information storing method, information storing unit, and disk drive | |
| KR102291379B1 (en) | Estimation of Usage Period and Erasing and Degaussing Method of Hard Disk Using Artificial Intelligence | |
| JPH08297928A (en) | Magnetic disk drive having inspection function for recording medium | |
| CN113179665B (en) | Using error correction-based metrics to identify poorly performing data storage devices | |
| EP3747008A2 (en) | Hard disk drive lifetime forecasting | |
| JP4111052B2 (en) | Apparatus incorporating disk type recording apparatus, method for controlling disk type recording apparatus, and computer program | |
| US20060047894A1 (en) | Data recording apparatus, and data recording control method and program | |
| JP4755510B2 (en) | Data recording apparatus and method for evaluating performance of host data transfer of data recording apparatus | |
| JP4215746B2 (en) | Information processing apparatus and life monitoring method | |
| CN113179657B (en) | Use of recovery behavior for prognosis and in-situ repair of data storage devices | |
| US8341468B2 (en) | Information apparatus | |
| KR101827920B1 (en) | Diagnosis system for removable media drive and method for generating diagnosis information for removable media drive | |
| JP2880701B2 (en) | Disk subsystem | |
| KR20060113551A (en) | Method and apparatus for time correlating defects found on hard disks | |
| EP1650657A2 (en) | Intelligent storage of device state in response to error condition | |
| JPH0157423B2 (en) | ||
| JP3598910B2 (en) | Information recording / reproducing device | |
| JP3714145B2 (en) | Auxiliary storage device backup method | |
| Khatri et al. | NVMe and PCIe SSD Monitoring in Hyperscale Data Centers |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060508 |
|
| A977 | Report on retrieval |
Effective date: 20070920 Free format text: JAPANESE INTERMEDIATE CODE: A971007 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20071002 |
|
| A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071129 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080318 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080331 |
|
| FPAY | Renewal fee payment (prs date is renewal date of database) |
Year of fee payment: 3 Free format text: PAYMENT UNTIL: 20110418 |
|
| LAPS | Cancellation because of no payment of annual fees |