JP2021190000A - Storage performance monitoring device and storage performance monitoring program - Google Patents
Storage performance monitoring device and storage performance monitoring program Download PDFInfo
- Publication number
- JP2021190000A JP2021190000A JP2020097643A JP2020097643A JP2021190000A JP 2021190000 A JP2021190000 A JP 2021190000A JP 2020097643 A JP2020097643 A JP 2020097643A JP 2020097643 A JP2020097643 A JP 2020097643A JP 2021190000 A JP2021190000 A JP 2021190000A
- Authority
- JP
- Japan
- Prior art keywords
- performance
- storage
- volume
- performance information
- read
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、ストレージ性能監視装置およびストレージ性能監視プログラムに関する。 The present invention relates to a storage performance monitoring device and a storage performance monitoring program.
ストレージシステムにおいては、当該ストレージシステムに備えられたストレージ装置やスイッチ等の性能を管理する性能管理機能を備えるものがある。 Some storage systems have a performance management function for managing the performance of storage devices, switches, and the like provided in the storage system.
従来の性能管理機能においては、ストレージ装置が提供するボリュームを管理対象として指定することで、性能情報を取得する対象範囲をボリューム単位に制限することが行なわれている。 In the conventional performance management function, the target range for acquiring performance information is limited to each volume by designating the volume provided by the storage device as the management target.
ただし、運用の変化や構成の変化など様々な要件により性能情報を確認すべき対象ボリュームは変化するため、一般的な運用においては、基本的には全てのボリュームに対して性能情報を取得することが行なわれている。 However, since the target volume for which performance information should be confirmed changes due to various requirements such as changes in operation and configuration, basically, in general operation, performance information should be acquired for all volumes. Is being done.
従来のストレージ装置の性能管理機能においては、取得した性能情報を、例えば、システム管理者が用いる端末装置のディスプレイに性能グラフとして時系列に表示することが行なわれる。このような性能グラフを表示するためには、対象となるボリュームを指定する必要があるが、ストレージ装置において、ボリュームの数は、例えば、最大で65000にもなる場合があり、特定のボリュームの性能グラフを表示させることが煩雑である場合がある。 In the performance management function of the conventional storage device, the acquired performance information is displayed in chronological order as a performance graph on the display of the terminal device used by the system administrator, for example. In order to display such a performance graph, it is necessary to specify the target volume, but in the storage device, the number of volumes may be, for example, up to 65,000, and the performance of a specific volume. Displaying the graph can be cumbersome.
また、従来の性能管理機能においては、取得した性能情報をCSV(comma-separated values)形式のデータとしてファイルに出力することも知られている。しかしながら、このようなデータ出力においては、対象ボリュームを指定して出力させることはできず、所望のボリュームの性能情報を得るためには、出力されたCSV形式のデータに対して、検索や絞り込み等のデータ加工を行なう必要がある。これにより、データ加工の手間がかかることで煩雑であるとともに、業務影響のある性能問題を早期に発見することが困難である。 Further, in the conventional performance management function, it is also known that the acquired performance information is output to a file as CSV (comma-separated values) format data. However, in such data output, it is not possible to specify the target volume and output it, and in order to obtain the performance information of the desired volume, the output CSV format data may be searched or narrowed down. It is necessary to process the data. This is complicated due to the time and effort required for data processing, and it is difficult to detect performance problems that have a business impact at an early stage.
なお、従来の性能管理機能においては、事前に閾値を設定することで性能値が閾値を超えたことを通知する手法も知られている。しかしながら、このような手法は、事前に定めた業務として必要なストレージ性能が確保できていることをチェックすることを目的として用いられる。そのため、最適な閾値を設定するためには、各ボリュームがどのように運用されているか等を把握する必要があり、最適な閾値を全てのボリュームのそれぞれに対して設定することは困難である。
1つの側面では、ストレージ装置におけるボリュームの状態を容易に把握できるようにすることを目的とする。
In the conventional performance management function, there is also known a method of notifying that the performance value exceeds the threshold value by setting the threshold value in advance. However, such a method is used for the purpose of checking that the storage performance required for a predetermined business is secured. Therefore, in order to set the optimum threshold value, it is necessary to grasp how each volume is operated, and it is difficult to set the optimum threshold value for each of all the volumes.
In one aspect, the purpose is to make it easy to grasp the state of the volume in the storage device.
このため、このストレージ性能監視装置は、ストレージ装置が管理する複数のボリュームの性能を監視するストレージ性能監視装置であって、前記複数のボリュームのそれぞれの第1リード性能情報に基づいて、ボリューム毎に、所定期間毎の性能比較値を求める性能比較値作成部と、前記複数のボリュームのそれぞれについて、最新の第1リード性能情報を前記性能比較値と比較し、前記最新の第1リード性能が比較元データに対して第1リード性能閾値以上乖離していると判定されたボリュームを抽出するボリューム抽出部と、前記抽出したボリュームを表す通知を出力する出力部とを備える。 Therefore, this storage performance monitoring device is a storage performance monitoring device that monitors the performance of a plurality of volumes managed by the storage device, and is used for each volume based on the first read performance information of each of the plurality of volumes. , The latest first read performance information is compared with the performance comparison value for each of the plurality of volumes and the performance comparison value creation unit for obtaining the performance comparison value for each predetermined period, and the latest first read performance is compared. It includes a volume extraction unit that extracts a volume determined to deviate from the original data by the first read performance threshold or more, and an output unit that outputs a notification representing the extracted volume.
一実施形態によれば、ストレージ装置におけるボリュームの状態を容易に把握できる。 According to one embodiment, the state of the volume in the storage device can be easily grasped.
以下、図面を参照して本ストレージ性能監視装置およびストレージ性能監視プログラムにかかる実施の形態を説明する。ただし、以下に示す実施形態はあくまでも例示に過ぎず、実施形態で明示しない種々の変形例や技術の適用を排除する意図はない。すなわち、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。また、各図は、図中に示す構成要素のみを備えるという趣旨ではなく、他の機能等を含むことができる。 Hereinafter, embodiments relating to the storage performance monitoring device and the storage performance monitoring program will be described with reference to the drawings. However, the embodiments shown below are merely examples, and there is no intention of excluding the application of various modifications and techniques not specified in the embodiments. That is, the present embodiment can be variously modified and implemented within a range that does not deviate from the purpose. Further, each figure does not have the purpose of having only the components shown in the figure, but may include other functions and the like.
(A)構成
図1は実施形態の一例としてのストレージシステム1の構成を模式的に示す図である。
(A) Configuration FIG. 1 is a diagram schematically showing a configuration of a
図1に例示するストレージシステム1は、ストレージ装置4,管理サーバ5および操作端末3を備える。これらのストレージ装置4,管理サーバ5および操作端末3は、通信回線2を介して相互に通信可能に構成されている。
The
通信回線2は、例えば、LAN(Local Area Network)であってもよい。また、図1に示す例においては、これらのストレージ装置4,管理サーバ5および操作端末3が1つの通信回線2を介して相互に接続されているが、これに限定されるものではなく、これらの接続形態は適宜変更して実施することができる。
The
また、ストレージシステム1には、図示しないホスト装置が通信可能に接続される。ストレージ装置4は、ホスト装置に対して記憶領域(ボリューム)を提供し、ホスト装置から発行されるデータのリード要求やライト要求に応じて、ボリュームに対するデータのリードやライトを行なう。
Further, a host device (not shown) is communicably connected to the
ホスト装置は、情報処理装置であり、例えば、RAM(Random Access Memory)やROM(Read Only Memory)等のメモリや、CPU(Central Processing Unit)を備えたコンピュータである。 The host device is an information processing device, and is, for example, a computer provided with a memory such as a RAM (Random Access Memory) or a ROM (Read Only Memory) and a CPU (Central Processing Unit).
ホスト装置は、ストレージ装置4が管理するボリュームに対してリードやライトのデータアクセス要求(I/O要求)を発行することで、ストレージ装置4が提供する記憶領域(ボリューム)にデータのライトやリードを行なう。
ストレージ装置4は、このI/O要求に応じてボリュームに対するデータアクセスを行ない、ホスト装置に対して応答を行なう。
The host device issues a read or write data access request (I / O request) to the volume managed by the
The
[ストレージ装置4]
ストレージ装置4は、情報処理装置の一例であり、図1に例示するように、1つ以上(図1に示す例では1つ)のCM(Controller Module)41およびストレージ42を備えてよい。
[Storage device 4]
The
ストレージ42は、ストレージ装置4によりホスト装置等に対して提供される記憶領域を有する。例えば、ストレージ42は、複数のディスク(物理ディスク)を備えてよい。例えば、ストレージ42は、複数のディスクによりRAID(Redundant Arrays of Inexpensive Disks)等のディスクアレイを構成してもよい。
The
ディスクは、HDD(Hard Disk Drive),SSD(Solid State Drive),ストレージクラスメモリ(Storage Class Memory:SCM)等の記憶装置であって、種々のデータを格納するものである。 A disk is a storage device such as an HDD (Hard Disk Drive), an SSD (Solid State Drive), and a storage class memory (SCM), and stores various data.
CM41は、ストレージ制御装置又は制御装置の一例である。CM41は、例えば、ストレージ装置4を制御し、ホスト装置に対して、ストレージ42の記憶領域を提供するための種々の制御を行なってよい。ストレージ装置4には、複数のCM41を備えることで冗長化構成を形成してもよい。
CM41は、例えば、RAIDシステムを構成するストレージ装置を制御するRAIDコントローラであってもよい。
CM41 is an example of a storage control device or a control device. The
The
CM41は、例示的に、CPU,メモリ,不揮発性記憶媒体を備えてよい。メモリは、CM41の動作に用いられる種々の情報を記憶する揮発性メモリの一例である。メモリの記憶領域の一部は、キャッシュメモリとして用いられる。すなわち、このメモリは、ストレージ42から読み出したデータを一時的に格納するリードキャッシュとして使用される。また、このメモリは、ストレージ42に書き込むデータが一時的に格納されるライトキャッシュとしても使用される。
The
なお、これらのリードキャッシュにおけるキャッシュヒット率(リードキャッシュヒット率)やライトキャッシュにおけるキャッシュヒット率はCM41において収集され、管理サーバ5において管理される。
The cache hit rate (read cache hit rate) in these read caches and the cache hit rate in the write cache are collected in the
また、CM41は図示しないCA(Channel Adapter)ポートを備えてもよく、このCAポートに接続された光通信ケーブルを介してホスト装置に接続されてもよい。
Further, the
[操作端末3]
操作端末3は、ストレージ管理者(システム管理者)等が使用する情報処理装置であり、例えば、RAMやROM等のメモリや、CPUを備えたコンピュータである。以下、システム管理者等をストレージ管理者という場合がある。また、操作端末3は、マウスやキーボード等の図示しない入力装置とディスプレイとを備え、ストレージ管理者は、ディスプレイに表示される操作画面等に対して、入力装置を用いて種々の入力操作を行なう。
[Operation terminal 3]
The
例えば、ストレージ管理者は、操作端末3の入力装置を用いて、ストレージ装置4の性能情報の取得指示の入力や、後述する応答時間ランキング情報を要求する指示を入力する。操作端末3のディスプレイには、例えば、管理サーバ5から提示(出力,送信)される情報が表示される。
For example, the storage manager uses the input device of the
例えば、操作端末3はWebブラウザを実行することで、後述する管理サーバ5のストレージ管理部51から送信されるWeb GUI(Graphical User Interface)のデータをディスプレイに表示させる。
後述する、ボリュームに関するランキング情報や異常関連情報がこの操作端末3のディスプレイに出力される。
For example, the
Ranking information and abnormality-related information regarding the volume, which will be described later, are output to the display of the
[管理サーバ5]
管理サーバ5は、例えば、サーバ機能を備える情報処理装置であり、ストレージ装置4の管理を行なう。管理サーバ5は、ストレージ装置4が管理する複数のボリュームの性能を監視するストレージ性能監視装置である。
図2は実施形態の一例としてのストレージシステム1の管理サーバ5の機能構成を例示する図である。
管理サーバ5は、図2に示すように、ストレージ管理部51,性能情報解析処理部52および記憶部53としての機能を備える。
[Management server 5]
The
FIG. 2 is a diagram illustrating a functional configuration of the
As shown in FIG. 2, the
――性能情報解析処理部52――
性能情報解析処理部52は、ストレージ装置4の性能情報を解析し、性能問題が発生しそうなボリュームをリストアップする。性能問題の発生により業務影響が予想されるボリュームを提示することで、対応が必要なボリュームを絞り込むことを可能とする。
--Performance information
The performance information
―比較元データの作成処理―
性能情報解析処理部52は、比較元データを作成する。
性能情報解析処理部52は、後述するストレージ管理部51が取得し、性能情報格納ファイル54に格納した、ストレージ装置4におけるボリュームのリードレスポンスタイム(第1リード性能情報,性能データ)を用いて比較元データを作成する。
-Comparison source data creation process-
The performance information
The performance information
性能情報格納ファイル54は、ストレージ装置4におけるボリューム(論理ボリューム)の性能を表す情報であり、ストレージ管理部51がストレージ装置4から収集した情報である。
図3は実施形態の一例としてのストレージシステム1における性能情報格納ファイル54を例示する図である。
この図3に例示する性能情報格納ファイル54は、項目としてファイル名,ヘッダー行およびデータ行を備える。
The performance
FIG. 3 is a diagram illustrating a performance
The performance
ファイル名には、ボリュームを特定する識別情報(論理ボリューム番号)が格納される。ヘッダー行には、性能情報の種類が格納される。図3に示す例においては、リードレスポンスタイム(Read Response Time)やリードキャッシュヒット率(Read Cache Hit Rate),ライトキャッシュヒット率(Write Cache Hit Rate)等が示されている。 The file name stores identification information (logical volume number) that identifies the volume. The type of performance information is stored in the header line. In the example shown in FIG. 3, a read response time (Read Response Time), a read cache hit rate (Read Cache Hit Rate), a write cache hit rate (Write Cache Hit Rate), and the like are shown.
データ行には、ストレージ装置4から送信された具体的な性能情報のデータ(リードレスポンスタイム,リードキャッシュヒット率,ライトキャッシュヒット率)等が格納される。
The data line stores specific performance information data (read response time, read cache hit rate, write cache hit rate) and the like transmitted from the
性能情報解析処理部52は、ストレージ管理部51が作成した性能情報格納ファイル54からリードレスポンスタイムを取得(抽出)し、性能データの作成に用いる。性能データは、ストレージ装置4において管理されるボリュームのリードレスポンスタイムの実績値(履歴)である。以下、性能情報格納ファイル54から取得したリードレスポンスタイムを処理対象リードレスポンスタイムという場合がある。処理対象リードレスポンスタイムは、性能情報解析処理部52が処理する最新のリードレスポンスタイム(第1リード性能情報)である。
The performance information
後述するストレージ管理部51は、各ボリュームのリードレスポンスタイムを30秒間隔で収集する。本ストレージシステム1においては、性能情報解析処理部52は、このように30秒間隔で取得されたリードレスポンスタイムを用いて、1時間単位で平均値を求める。
The
性能情報解析処理部52は、例えば、これらの30秒間隔で取得した120回分のリードレスポンスタイムの平均値を算出することで、1時間単位の平均値を求める。
性能情報解析処理部52は、各ボリュームのリードレスポンスタイムの1時間単位の平均値の算出に、1Hデータ格納テーブル56を用いる。
図4は実施形態の一例としてのストレージシステム1における1Hデータ格納テーブル56を例示する図である。
The performance information
The performance information
FIG. 4 is a diagram illustrating the 1H data storage table 56 in the
図4に例示する1Hデータ格納テーブル56においては、ボリューム名とリードレスポンスタイムの平均値とが対応付けられている。ボリューム名にはストレージ装置4において管理される各ボリュームを特定する情報が用いられる。
In the 1H data storage table 56 illustrated in FIG. 4, the volume name and the average value of the read response time are associated with each other. Information that identifies each volume managed by the
性能情報解析処理部52は、ストレージ管理部51が30秒毎に取得した各ボリュームのリードレスポンスタイムを、1Hデータ格納テーブル56に対して、各ボリュームのボリューム名に対応させて格納する。また、性能情報解析処理部52は、同一のボリュームから取得される複数のリードレスポンスタイムの平均値を算出し、1Hデータ格納テーブル56の値を更新する。
1Hデータ格納テーブル56には、各ボリュームの毎時のリードレスポンスタイムの平均値が格納される。
The performance information
The average value of the hourly read response time of each volume is stored in the 1H data storage table 56.
性能情報解析処理部52は、例えば、時刻が毎時の0分となったことを検知することで、1時間分のリードレスポンスタイムの平均値を算出したことを認識してもよい。
The performance information
また、性能情報解析処理部52は、各平均値の算出に用いたリードレスポンスタイムの数を計数することで、最新の120回分のリードレスポンスタイムの平均値を算出したことを認識し、1時間分のリードレスポンスタイムの平均値を算出したことを認識してもよい。性能情報解析処理部52は、リードレスポンスタイムの平均値の算出を開始してからの経過時間を算出することで、最新の120回分のリードレスポンスタイムの平均値を算出したことを認識してもよい。
記憶部53には、各ボリュームについて、各時間帯のリードレスポンスタイムの平均値がログ情報59として格納されてもよい。
図5は実施形態の一例としてのストレージシステム1における性能データのログ情報59を例示する図である。
Further, the performance information
The
FIG. 5 is a diagram illustrating
図5に例示する性能データのログ情報59においては、ストレージ装置4において管理される複数のボリューム(Vol.1〜3を図示)について、月曜〜日曜までの各曜日のそれぞれの0〜23時の各時間帯毎のリードレスポンスタイムの平均値を示している。
以下、各時間帯におけるリードレスポンスタイムの平均値を、1時間毎のリードレスポンスタイムもしくは時間帯毎の性能データという場合がある。
In the performance data log
Hereinafter, the average value of the read response time in each time zone may be referred to as the read response time for each hour or the performance data for each time zone.
また、図5においては、ログ情報59において、1〜5週目までの5週間分のリードレスポンスタイムの情報を示している。なお、この図5に例示するログ情報59においては、便宜上、一部の時間帯(3〜22時)のリードレスポンスタイムの図示を省略している。
Further, in FIG. 5, in the
性能情報解析処理部52は、1Hデータ格納テーブル56のデータを用いて各時間帯のリードレスポンスタイムの平均値の値を更新する。例えば、1Hデータ格納テーブル56に格納される各ボリュームのリードレスポンスタイムの平均値が1時間分のリードレスポンスタイムを用いて算出されると、性能情報解析処理部52は、1Hデータ格納テーブル56の値を用いて、当該ボリュームに対する時間条件が一致する値を更新する。
The performance information
性能情報解析処理部52は、1時間が経過する毎に1Hデータ格納テーブル56の値を用いて評価データテーブル57を更新してよい。また、性能情報解析処理部52は、毎時0分となるタイミングで、1Hデータ格納テーブル56の値を用いて評価データテーブル57を更新してよい。
The performance information
性能情報解析処理部52は、例えば、ログ情報59の直近4週間分のデータを用いて、各曜日の各時間帯のそれぞれのリードレスポンスタイムの平均値を算出することで、評価データテーブル57を作成する。
図6は実施形態の一例としてのストレージシステム1における評価データテーブル57を例示する図である。
The performance information
FIG. 6 is a diagram illustrating an evaluation data table 57 in the
この図6に例示する評価データテーブル57は、図5に例示した時間帯毎の性能データに基づき、直近の所定期間(本実施形態では4週間分)のレスポンスタイムのデータを用いて、各曜日の各時間帯毎の性能データの平均値を算出することで構成されている。この評価データテーブル57に登録された時間帯毎の値のそれぞれが比較元データである。 The evaluation data table 57 illustrated in FIG. 6 is based on the performance data for each time zone illustrated in FIG. 5, and uses the response time data of the latest predetermined period (4 weeks in the present embodiment) for each day of the week. It is composed by calculating the average value of the performance data for each time zone of. Each of the values registered in the evaluation data table 57 for each time zone is the comparison source data.
性能情報解析処理部52は、4週間分の性能データに基づき、同じ曜日、同じ時間帯のリードレスポンスタイムを抽出し、これらの平均値を算出することで比較元データを求める。以下、同じ曜日、且つ、同じ時間帯であることを時間条件が同一であるという場合がある。
The performance information
例えば、2020年3月2日に、Vol.3について2:00〜3:00の時間帯の比較元データを算出するには、性能情報解析処理部52は、2020年の2月10日,2月17日,2月24日および3月2日の各2:00〜3:00の時間帯の各リードレスポンスタイムの平均値を算出する(図5の符号P1参照)。
For example, on March 2, 2020, in order to calculate the comparison source data for Vol.3 in the time zone from 2:00 to 3:00, the performance information
ストレージ装置4のボリュームを用いる業務のバリエーションは多岐に渡り、ボリュームの利用用途や目的も異なる。そこで、本ストレージシステム1において、性能情報解析処理部52は、ストレージ装置4における全ボリュームに対して、例えば、1時間単位、且つ、曜日毎に、比較元データを用意する。このように、直近の4週間分のデータの平均値を算出して比較元データとすることで、比較元データの妥当性を高めることができる。
There are a wide variety of tasks that use the volume of the
性能情報解析処理部52は、上述の如く算出した1時間毎のリードレスポンスタイムの平均値を24時間(=1日)分、記憶部53に保持する(比較元データ数=24)。更に、性能情報解析処理部52は、収集した1日分の値を曜日ごとに7日(=1週間)分保持することで、1週間分のリードレスポンスタイムの平均値を記憶部53に保持する(比較元データ数=24×7=168)。
The performance information
さらに、性能情報解析処理部52は、ログ情報59として、このような1週間分のリードレスポンスタイムの平均値を4週間分以上(図5に示した例では5週間分)、記憶部53に保持する。
Further, the performance information
評価データテーブル57に登録された各比較元データは、複数のボリュームのそれぞれのリードレスポンスタイムに基づいて作成された、複数のボリューム毎に、所定期間毎(1時間毎)の性能比較値に相当する。 Each comparison source data registered in the evaluation data table 57 corresponds to a performance comparison value for each predetermined period (every hour) for each of the plurality of volumes created based on the read response times of the plurality of volumes. do.
また、この評価データテーブル57を作成する性能情報解析処理部52は、複数のボリュームのそれぞれの第1リード性能情報(リードレスポンスタイム)に基づいて、複数のボリューム毎に、所定期間毎(1時間毎)の性能比較値(比較元データ,評価データテーブル57)を求める性能比較値作成部に相当する。
Further, the performance information
また、性能情報解析処理部52は、性能情報格納ファイル54から取得したリードレスポンスタイムを性能データの作成に用いるに際して、評価データテーブル57において処理対象リードレスポンスタイムと時間条件が同一である比較元データがある場合には、当該リードレスポンスタイムの妥当性を判断する。
Further, when the performance information
すなわち、性能情報解析処理部52は、処理対象リードレスポンスタイムを、評価データテーブル57における処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較し、所定の閾値(第1閾値)以上乖離しているかを判断する。ここで、第1閾値は、例えば、50%である。なお、この第1閾値はストレージ管理者等が任意に設定してもよい。第1閾値は、解析処理設定情報55にAnalysis_deviation_rangeとして登録されている。
図7は実施形態の一例としてのストレージシステム1における解析処理設定情報55を例示する図である。
That is, the performance information
FIG. 7 is a diagram illustrating analysis
解析処理設定情報55は、性能情報解析処理部52が使用する閾値を格納する。図7に例示する解析処理設定情報55においては、キーワード名,値および説明が関連付けられている。
The analysis
キーワード名は、閾値を特定するための情報であり、図7に示す例においては、キーワード名がAnalysis_deviation_range,Analysis_target_rangeおよびAnalisys_cache_hit_rateの3種類の閾値が設定されている。 The keyword name is information for specifying the threshold value, and in the example shown in FIG. 7, three types of threshold values are set for the keyword name: Analysis_deviation_range, Analysis_target_range, and Analisys_cache_hit_rate.
Analysis_deviation_rangeは、上述した第1閾値(異常判断閾値)であり、この図7に示す例においては値として50%が設定されている。また、このAnalysis_deviation_rangeの説明として、性能データの作成から除外させるデータの判断に用いるデータの乖離率であることが設定されている。 Analysis_deviation_range is the above-mentioned first threshold value (abnormality determination threshold value), and in the example shown in FIG. 7, 50% is set as a value. Further, as an explanation of this Analysis_deviation_range, it is set to be the deviation rate of the data used for determining the data to be excluded from the creation of the performance data.
Analysis_target_rangeは、後述する第2閾値(第1リード性能閾値)であり、この図7に示す例においては値として20%が設定されている。また、このAnalysis_target_rangeの説明として、性能に問題があるかの判断に用いる平均値との乖離率であることが設定されている。この第2閾値については後述する。 Analysis_target_range is a second threshold value (first read performance threshold value) described later, and in the example shown in FIG. 7, 20% is set as a value. Further, as an explanation of this Analysis_target_range, it is set to be a deviation rate from the average value used for determining whether there is a problem in performance. This second threshold will be described later.
Analisys_cache_hit_rateは、後述する第3閾値(第2リード性能閾値)であり、この図7に示す例においては値として80%が設定されている。また、このAnalisys_cache_hit_rateの説明として、キャッシュヒット率であることが設定されている。この第3閾値についても後述する。 Analisys_cache_hit_rate is a third threshold value (second read performance threshold value) described later, and in the example shown in FIG. 7, 80% is set as a value. Also, as an explanation of this Analisys_cache_hit_rate, it is set to be a cache hit rate. This third threshold will also be described later.
処理対象リードレスポンスタイムが時間条件が同一である比較元データに対して、所定の閾値(第1閾値)以上乖離している場合には、当該処理対象リードレスポンスタイムは突発的な要因により発生した異常データであると考えられる。そこで、性能情報解析処理部52は、当該処理対象リードレスポンスタイムは性能データの作成に用いるには妥当でないと判断する。
When the process target read response time deviates from the comparison source data having the same time condition by a predetermined threshold value (first threshold value) or more, the process target read response time is generated due to a sudden factor. It is considered to be abnormal data. Therefore, the performance information
性能情報解析処理部52は、性能データの作成に用いるには妥当でないと判断された処理対象リードレスポンスタイムについては、性能データの作成、すなわち平均値の算出対象から除外する。
The performance information
また、性能情報解析処理部52は、性能データの作成に用いるには妥当でないと判断する処理対象リードレスポンスタイム(異常データ)を検知した場合には、以下の(1)〜(5)の情報をストレージ装置4から収集し、ストレージ管理者に対して通知する。これらの(1)〜(5)の情報は、例えば、当該処理対象リードレスポンスタイムと同一タイミングで、同一ボリューム(対象ボリューム)から収集された性能情報格納ファイル54から抽出される。
(1)対象ボリュームのリードレスポンスタイムとキャッシュヒット率
(2)当該ボリュームが存在するRAIDグループのリードレスポンスタイムとキャッシュヒット率
(3)当該RAIDグループを構成するディスクのビジー率
(4)当該RAIDグループが接続されているCM41のビジー率
(5)当該ボリュームが接続されているCAポートのデータ転送量
Further, when the performance information
(1) Read response time and cache hit rate of the target volume (2) Read response time and cache hit rate of the RAID group in which the volume exists (3) Busy rate of the disks constituting the RAID group (4) RAID group Busy rate of CM41 to which is connected (5) Data transfer amount of the CA port to which the volume is connected
性能情報解析処理部52は、例えば、これらの情報を記載した電子メールを作成してストレージ管理者に送信することで、ストレージ管理者に異常を通知する。以下、上記の(1)〜(5)の情報を異常関連情報という場合がある。
The performance information
異常関連情報を含む異常通知を受信したストレージ管理者は、例えば、操作端末3を用いてこの電子メールを受信して、異常データの発生をリアルタイムに確認することができる。
なお、ストレージ装置4から上述した異常関連情報を取得することは既知の手法で実現することができ、その説明は省略する。
The storage administrator who has received the abnormality notification including the abnormality-related information can receive this e-mail using, for example, the
It should be noted that the acquisition of the above-mentioned abnormality-related information from the
―第1の比較処理―
性能情報解析処理部52は、処理対象リードレスポンスタイムを当該処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較する。
-First comparison process-
The performance information
性能情報解析処理部52は、処理対象リードレスポンスタイムを、評価データテーブル57における処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較する。そして、性能情報解析処理部52は、処理対象リードレスポンスタイムが、比較元データに対して、所定の閾値(第2閾値)以上増加する方向で乖離しているかを判断する。ここで、第2閾値は、例えば、20%である。第2閾値は、第1リード性能閾値に相当する。
The performance information
なお、この第2閾値はストレージ管理者等が任意に設定してもよい。第2閾値は、解析処理設定情報55にAnalysis_target_rangeとして登録されている。
The second threshold value may be arbitrarily set by the storage administrator or the like. The second threshold value is registered as Analysis_target_range in the analysis
リードレスポンスタイムが比較元データに対して、第2閾値以上乖離して増加している状態は、リードレスポンスタイムが平時よりも増加しており、性能が低下していることを示す。 A state in which the read response time deviates from the comparison source data by a second threshold value or more and increases indicates that the read response time is longer than in normal times and the performance is deteriorated.
性能情報解析処理部52は、複数のボリュームのそれぞれについて、最新の第1リード性能情報(処理対象リードレスポンスタイム)を性能比較値と比較し、最新の第1リード性能が比較元データに対して第2閾値(第1リード性能閾値)以上乖離していると判定されたボリュームを抽出するボリューム抽出部に相当する。
The performance information
―第2の比較処理―
性能情報解析処理部52は、第1の比較処理の結果、処理対象リードレスポンスタイムが比較元データに対して、所定の閾値(第2閾値)以上乖離している場合に、第2の比較処理を実行する。
-Second comparison process-
The performance information
第2の比較処理においては、性能情報解析処理部52は、性能情報格納ファイル54から当該ボリュームのリードキャッシュヒット率(第2リード性能情報)を取得し、所定の閾値(第3閾値)と比較する。
In the second comparison process, the performance information
リードキャッシュヒット率は、処理対象リードレスポンスタイムが比較元データに対して、所定の閾値(第2閾値)以上乖離していることを検知した時点における最新の性能情報格納ファイル54から抽出した値であってもよい。また、比較元データに対して、所定の閾値(第2閾値)以上乖離していることが検知された処理対象リードレスポンスタイムと同じタイミングで収集部102された性能情報格納ファイル54から抽出した値であってもよい。そのため、性能情報格納ファイル54は、複数世代分のリードキャッシュヒット率を記憶部53に保存しておくことが望ましい。
The read cache hit rate is a value extracted from the latest performance
ここで、第3閾値は、例えば、80%である。なお、この第3閾値はストレージ管理者等が任意に設定してもよい。第2閾値は、解析処理設定情報55にAnalisys_cache_hit_rateとして登録されている。
Here, the third threshold value is, for example, 80%. The third threshold value may be arbitrarily set by the storage administrator or the like. The second threshold value is registered as Analisys_cache_hit_rate in the analysis
リードレスポンスタイムが比較元データに対して第2閾値以上乖離しており、且つ、リードキャッシュヒット率が第3閾値(80%)以下の場合、当該ボリュームには何らかの性能問題が発生している可能性があると判断することができる。第3閾値は、第2リード性能閾値に相当する。
性能情報解析処理部52は、リードキャッシュヒット率が第3閾値(80%)以下であると判断したボリュームをランキングテーブル58に登録する。
図8は実施形態の一例としてのストレージシステム1におけるランキングテーブル58を例示する図である。
If the read response time deviates from the comparison source data by the second threshold value or more and the read cache hit rate is equal to or less than the third threshold value (80%), some performance problem may have occurred in the volume. It can be judged that there is sex. The third threshold corresponds to the second read performance threshold.
The performance information
FIG. 8 is a diagram illustrating a ranking table 58 in the
ランキングテーブル58は、第2閾値(Analysis_target_range)に対する、性能が劣化する方向でのリードレスポンスタイムの乖離率のランキングを示す。 The ranking table 58 shows the ranking of the deviation rate of the read response time in the direction in which the performance deteriorates with respect to the second threshold value (Analysis_target_range).
図8に例示するランキングテーブル58においては、装置名,日時,ランク,ボリューム番号,ボリューム名,応答時間,ビジー率および乖離率を関連付けられている。 In the ranking table 58 illustrated in FIG. 8, the device name, date and time, rank, volume number, volume name, response time, busy rate, and deviation rate are associated with each other.
装置名はストレージ装置4を特定する識別情報である。本ストレージシステム1においてはストレージ装置4が1つ備えられているので、図8に示す例においては、全てのエントリに、このストレージ装置4のストレージ名“装置A”が設定されている。複数のストレージ装置4が備えられる場合には、複数のストレージ装置4の装置名が設定され得る。
The device name is identification information that identifies the
日時は、例えば、当該ボリュームがランキングテーブル58に登録された日時であってもよい。ランクは、ランキングテーブル58における当該ボリュームの順位を表し、乖離率が高いボリュームほど高い順位が設定される。 The date and time may be, for example, the date and time when the volume is registered in the ranking table 58. The rank represents the ranking of the volume in the ranking table 58, and the higher the divergence rate, the higher the ranking is set.
ボリューム番号はボリュームを識別するための識別情報であり、ボリューム名はボリュームに対して任意に設定された名称である。ボリューム名はユニークであることが望ましい。応答時間はボリュームにおけるリードレスポンスタイムであり、ビジー率はボリュームにおけるビジー率である。乖離率は、性能情報解析処理部52が算出した、リードレスポンスタイムの第2閾値に対する乖離率である。
装置名,ボリューム番号,ボリューム名,応答時間,ビジー率は、例えば、性能情報格納ファイル54から抽出することで取得することができる。
The volume number is identification information for identifying the volume, and the volume name is a name arbitrarily set for the volume. The volume name should be unique. The response time is the read response time in the volume, and the busy rate is the busy rate in the volume. The deviation rate is a deviation rate with respect to the second threshold value of the read response time calculated by the performance information
The device name, volume number, volume name, response time, and busy rate can be obtained by, for example, extracting from the performance
そして、ランキングテーブル58においては、ランクの順に従ってエントリが並べられている。すなわち、乖離率が最も高いものから順にボリュームが並べられている。 Then, in the ranking table 58, the entries are arranged in the order of rank. That is, the volumes are arranged in order from the one with the highest divergence rate.
ランキングテーブル58には、リードレスポンスタイムが比較元データに対して第2閾値以上乖離するほど増加しており、且つ、リードキャッシュヒット率が第3閾値以下となった複数のボリュームが示されている。また、これらの複数のボリュームは、リードレスポンスタイムの比較元データからの乖離率が高いものから順に並べられている。 The ranking table 58 shows a plurality of volumes in which the read response time is increased so as to deviate from the comparison source data by the second threshold value or more, and the read cache hit rate is equal to or less than the third threshold value. .. Further, these plurality of volumes are arranged in order from the one having the highest deviation rate from the comparison source data of the read response time.
性能情報解析処理部52は、例えば、1時間毎にランキングテーブル58を更新して最新の情報にする。なお、性能情報解析処理部52は、定期もしくは不定期にランキングテーブル58を更新してもよい。
The performance information
――記憶部53――
記憶部53は、性能情報格納ファイル54,解析処理設定情報55,1Hデータ格納テーブル56,評価データテーブル57,ランキングテーブル58およびログ情報59を記憶(格納)する。
記憶部53は、例えば、図14を用いて後述する記憶装置13やメモリ12によって実現される。
--
The
The
――ストレージ管理部51――
ストレージ管理部51は、ストレージ装置4の性能情報を収集する。ストレージ管理部51は、所定時間毎に(例えば、30秒間隔で)、ストレージ装置4に対して、性能情報の送信を要求する通知を発行する。
--
The
ストレージ装置4は、この性能情報の送信要求に対して、自身が管理するボリュームの性能情報を応答する。性能情報は、上述した性能情報格納ファイル54に登録される各情報である。性能情報には、少なくともボリューム毎のリードレスポンスタイム(応答時間)とリードキャッシュヒット率とが含まれる。なお、ストレージ装置4におけるこれらの性能情報の収集および管理サーバ5への応答は、既知の手法により実現することができ、その説明は省略する。
ストレージ管理部51は、ストレージ装置4から送信されるこれらの性能情報を受信して、性能情報格納ファイル54に登録する。
このように、ストレージ管理部51は、ストレージ装置4の性能情報を管理する性能管理機能を実現する。
The
The
In this way, the
また、ストレージ管理部51は、性能情報解析処理部52に対して、ストレージ装置4の性能解析の実行指示を発行する。ストレージ管理部51は、所定時間毎に(例えば、30秒間隔で)、性能情報解析処理部52に対して、ストレージ装置4の性能解析の実行指示を発行する。
Further, the
さらに、ストレージ管理部51は、操作端末3からランキング情報の要求を受信すると、ランキングテーブル58を参照してランキング情報を抽出し、操作端末3に提示する。ストレージ管理部51は、抽出したボリュームを表す通知を出力する出力部に相当する。
Further, when the
例えば、ストレージ管理部51は、ランキングテーブル58の上位(例えば、1位〜5位)に登録されたボリュームの情報を抽出し、ストレージ管理者にメールで通知してもよい。また、ストレージ管理部51は、ランキング情報を用いてWeb GUIの表示データを生成し、操作端末3に送信してもよい。
図9は実施形態の一例としてのストレージシステム1の操作端末3に表示される表示画面を例示する図である。
For example, the
FIG. 9 is a diagram illustrating a display screen displayed on the
この図9に示す表示画面はWeb GUIにより生成されたダッシュボード画面を示す。ダッシュボード画面は、ストレージ装置4に関する情報を示すものであり、図9に示す例においては、装置ステータス,ログ,RAIDgroup容量サマリ等とともに、乖離率ランキングが示されている(図9の符号P2参照)。
The display screen shown in FIG. 9 shows a dashboard screen generated by the Web GUI. The dashboard screen shows information about the
装置ステータスは、管理サーバ5が管理するストレージ装置4の状態(ステータス)を示す。ログは、本ストレージシステム1において行なわれた処理の履歴を示す。RAIDgroup容量サマリは本ストレージシステム1において管理される各RAIDグループの容量に関する情報を示す。
The device status indicates the state (status) of the
乖離率ランキングは、ストレージ管理部51がランキングテーブル58から抽出したランキング情報を提示するものである。図9に示す例においては、乖離率ランキングには、ストレージ装置4によって管理されるボリュームのうち、性能情報解析処理部52によって設定された、ランキングテーブル58における上位(1位〜5位)の5つのボリュームが、その乖離率が高いものから順に並べられている。
The divergence rate ranking presents ranking information extracted from the ranking table 58 by the
また、図9に例示する乖離率ランキングにおいては、各ボリュームに乖離率を対応付けて示すとともに、更に、応答時間およびビジー率も対応付けて示している。 Further, in the deviation rate ranking illustrated in FIG. 9, the deviation rate is shown in association with each volume, and the response time and the busy rate are also shown in association with each other.
この乖離率ランキングにおいては、リードレスポンスタイムが比較元データに対して第2閾値以上乖離するほど増加しており、且つ、リードキャッシュヒット率が第3閾値以下となった複数のボリュームが示されている。そして、これらの複数のボリュームは、リードレスポンスタイムの比較元データからの乖離率が高いものから順に並べられている。
乖離率ランキングにおいては、上位にあるボリュームほど性能問題が発生するおそれがあると考えることができる。
In this deviation rate ranking, a plurality of volumes in which the read response time deviates from the comparison source data by the second threshold value or more and the read cache hit rate is equal to or less than the third threshold value are shown. There is. Then, these plurality of volumes are arranged in order from the one having the highest deviation rate from the comparison source data of the read response time.
In the divergence rate ranking, it can be considered that the higher the volume, the more likely the performance problem will occur.
従って、操作端末3を使用するストレージ管理者は、この乖離率ランキングを参照することで、性能問題が発生するおそれがあるボリュームを把握することができる。
Therefore, the storage administrator who uses the
なお、図9に示す例においては、乖離率ランキングには5つのボリュームが示されているが、これに限定されるものではない。乖離率ランキングに4つ以下もしくは6つ以上のボリュームを表示させてもよい。また、ストレージ管理者は、乖離率ランキングに表示させるボリュームの数を任意に設定できるようにしてもよい。 In the example shown in FIG. 9, five volumes are shown in the divergence rate ranking, but the volume is not limited to this. Volumes of 4 or less or 6 or more may be displayed in the deviation rate ranking. Further, the storage administrator may arbitrarily set the number of volumes to be displayed in the deviation rate ranking.
また、性能情報解析処理部52は、乖離率ランキングの上位(例えば、1位〜5位)にランキングされた状態が所定回数(例えば、3回)以上、生じたボリュームについても、上述した異常関連情報と同様の情報をストレージ装置4から収集し、ストレージ管理者に対して通知してもよい。
Further, the performance information
性能情報解析処理部52は、例えば、上述した異常関連情報を記載した電子メールを作成してストレージ管理者に送信することで、ストレージ管理者に異常を通知する。ストレージ管理者は、例えば、操作端末3を用いてこの電子メールを受信して、異常データの発生をリアルタイムに確認することができる。
The performance information
(B)動作
上述の如く構成された実施形態の一例としてのストレージシステム1におけるボリュームの性能情報取得処理を、図10に示すフローチャート(ステップA1〜A10)に従って説明する。
(B) Operation The volume performance information acquisition process in the
なお、図10において、ステップA1,A2は操作端末3における処理を、ステップA3〜A7は管理サーバ5における処理を、ステップA8〜A10はストレージ装置4における処理を、それぞれ示す。
In FIG. 10, steps A1 and A2 show processing in the
ステップA1において、例えば、ストレージ管理者が、操作端末3を操作して性能情報取得を閲覧するための入力操作を行なうと、操作端末3は、管理サーバ5に対して、性能情報取得開始を指示する。
In step A1, for example, when the storage administrator operates the
ステップA3において、管理サーバ5のストレージ管理部51は、操作端末3から受信した指示内容を確認し、ストレージ装置4に対して、性能情報の送信を応急する通知を発行する。
In step A3, the
ステップA8において、ストレージ装置4は、ストレージ管理部51から受信した性能情報の送信要求に基づき、各ボリュームの性能情報の取得を開始する。ストレージ装置4は、管理サーバ5(ストレージ管理部51)に対して、性能情報を取得中である旨の応答を行なう。ストレージ管理部51は、このストレージ装置4からの応答に基づき、性能情報取得中状態である旨を示す情報(例えばフラグ)を、記憶部53等に設定する(ステップA4)。また、ストレージ管理部51は、操作端末3に対して、性能情報取得中状態である旨を通知する。例えば、ストレージ管理部51は、性能情報取得中状態である旨を表す表示画面データをWeb GUI等により生成し、操作端末3に送信する。
ステップA2において、操作端末3のディスプレイには、ボリュームの性能情報の取得中である旨の情報が表示される。
また、管理サーバ5においては、ストレージ管理部51がストレージ装置4に対して、性能情報の送信を要求する通知を発行する(ステップA5)。
In step A8, the
In step A2, the display of the
Further, in the
ステップA9において、ストレージ装置4は、自身が管理する各ボリュームの性能情報を作成し、ステップA10において、性能情報を管理サーバ5に応答する。
In step A9, the
ステップA6において、管理サーバ5のストレージ管理部51は、ストレージ装置4から受信した性能情報を性能情報格納ファイル54に格納する。その後、ストレージ管理部51は、性能情報解析処理部52に対して性能情報の解析処理の実行を指示し(ステップA7)、ステップA5に戻る。ストレージ管理部51は、これらのステップA5,A9,A10,A6,A7の処理を、所定時間(本実施形態では30秒)間隔で繰り返し実行する。
In step A6, the
次に、実施形態の一例としてのストレージシステム1における性能情報解析処理部52による性能情報の解析処理を図11および図12に示すフローチャートに従って説明する。
なお、図11はステップB1〜B10の処理を、図12はステップC1〜C8の処理を、それぞれ示す。
Next, the analysis processing of the performance information by the performance information
Note that FIG. 11 shows the processing of steps B1 to B10, and FIG. 12 shows the processing of steps C1 to C8.
ステップB1において、性能情報解析処理部52は、記憶部53から解析処理設定情報55を読み込んで、各第1閾値,第2閾値および第3閾値を取得する。取得した閾値は、例えば、メモリ12(図14参照)の所定の記憶領域に格納される。
In step B1, the performance information
ステップB2において、性能情報解析処理部52は、例えば、システムに備えられたカレンダーや時計のアプリケーションから現時点の曜日および時刻を取得する。
In step B2, the performance information
ステップB3において、性能情報解析処理部52は、性能情報格納ファイル54を参照して、ストレージ装置4において管理されるボリュームの性能データ(処理対象リードレスポンスタイム)を抽出する。
ステップB4において、性能情報解析処理部52は、処理対象リードレスポンスタイムを用いてテーブル更新処理を行なう。
この性能情報解析処理部52によるテーブル更新処理を、図12に示すフローチャート(ステップC1〜C8)に従って説明する。
In step B3, the performance information
In step B4, the performance information
The table update process by the performance information
ステップC1において、性能情報解析処理部52は、ステップB3において取得した処理対象リードレスポンスタイムに対応するボリュームが1Hデータ格納テーブル56に登録されているかを確認する。
In step C1, the performance information
処理対象リードレスポンスタイムに対応するボリュームが1Hデータ格納テーブル56に登録されていない場合には(ステップC1のNOルート参照)、ステップC2において、性能情報解析処理部52は、処理対象リードレスポンスタイムに対応するボリュームを、1Hデータ格納テーブル56にエントリとして追加する。その後、ステップC3に移行する。
When the volume corresponding to the process target read response time is not registered in the 1H data storage table 56 (see the NO route in step C1), in step C2, the performance information
一方、ステップC1における確認の結果、処理対象リードレスポンスタイムに対応するボリュームが1Hデータ格納テーブル56に登録されている場合には(ステップC1のYESルート参照)、ステップC6に移行する。 On the other hand, as a result of the confirmation in step C1, if the volume corresponding to the process target read response time is registered in the 1H data storage table 56 (see the YES route in step C1), the process proceeds to step C6.
ステップC6においては、性能情報解析処理部52は、処理対象リードレスポンスタイムがテーブル更新に用いるのに妥当なデータであるかを確認する。すなわち、性能情報解析処理部52は、処理対象リードレスポンスタイムを、評価データテーブル57における処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較し、第1閾値(50%)以上乖離しているかを判断する。
In step C6, the performance information
処理対象リードレスポンスタイムが比較元データに対して50%以上乖離している場合には、処理対象リードレスポンスタイムはテーブル更新に用いるのに妥当でないと判断される(ステップC6のNOルート参照)。そこで、ステップC8において、性能情報解析処理部52は、異常関連情報を収集し、収集した異常関連情報を記載した電子メールを作成してストレージ管理者に送信し、ステップC4に移行する。
When the process target read response time deviates by 50% or more from the comparison source data, it is determined that the process target read response time is not appropriate for use in updating the table (see NO route in step C6). Therefore, in step C8, the performance information
これに対して、処理対象リードレスポンスタイムが比較元データに対して50%以上乖離していない場合には、処理対象リードレスポンスタイムはテーブル更新に用いるのに妥当であると判断される(ステップC6のYESルート参照)。そこで、ステップC7において、性能情報解析処理部52は、1Hデータ格納テーブル56に格納済のデータと処理対象リードレスポンスタイムとを用いて、リードレスポンスタイムの平均値を算出する。
On the other hand, when the process target read response time does not deviate by 50% or more from the comparison source data, it is determined that the process target read response time is appropriate to be used for table update (step C6). See the YES route in). Therefore, in step C7, the performance information
ステップC3において、性能情報解析処理部52は、算出したリードレスポンスタイムの平均値を1Hデータ格納テーブル56に格納する。すなわち、性能情報解析処理部52は、処理対象リードレスポンスタイムを用いて、1Hデータ格納テーブル56における当該処理対象リードレスポンスタイムに対応するボリュームのリードレスポンスタイムを更新し、ステップC4に移行する。
In step C3, the performance information
ステップC4において、性能情報解析処理部52は、評価データテーブル57の更新を行なう必要があるかを確認する。例えば、性能情報解析処理部52は、時刻が毎時の0分を経過し時間帯が変わった否かを判断することで、ログ情報59および評価データテーブル57の更新が必要であるか否かを判断する。また、性能情報解析処理部52は、前回の確認時から1時間が経過し時間帯が変わったかを判断することで、ログ情報59および評価データテーブル57の更新が必要であるか否かを判断してもよい。
In step C4, the performance information
前回の確認時から時間帯が変わり、評価データテーブル57の更新が必要であると判断した場合には(ステップC4のYESルート参照)、ステップC5に移行する。 If the time zone has changed since the previous confirmation and it is determined that the evaluation data table 57 needs to be updated (see the YES route in step C4), the process proceeds to step C5.
ステップC5において、性能情報解析処理部52は、1Hデータ格納テーブル56の値を用いてログ情報59を更新し、この更新したログ情報59を用いて評価データテーブル57を更新する。その後、処理は、図11のステップB5に移行する。また、ステップC4における確認の結果、評価データテーブル57の更新が必要でないと判断した場合にも(ステップC4のNOルート参照)、図11のステップB5に移行する。
In step C5, the performance information
性能情報解析処理部52は、処理対象リードレスポンスタイムに基づき評価データテーブル57を参照して(ステップB5)、処理対象リードレスポンスタイムを、当該処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較する(ステップB6:第1の比較処理)。
The performance information
ステップB7において、性能情報解析処理部52は、処理対象リードレスポンスタイムが妥当な値であるか否かを判断する。ここで、処理対象リードレスポンスタイムがボリュームにおける何らかの異常の発生を示唆する値である場合に、処理対象リードレスポンスタイムが妥当な値ではないと判断される。すなわち、性能情報解析処理部52は、処理対象リードレスポンスタイムが、比較元データに対して、所定の閾値(第2閾値)以上増加する方向で乖離しているかを判断する。
In step B7, the performance information
処理対象リードレスポンスタイムが、比較元データに対して、所定の閾値(第2閾値)以上増加する方向で乖離している場合には、処理対象リードレスポンスタイムは、ボリュームにおける何らかの異常の発生を示唆するものであり、処理対象リードレスポンスタイムが妥当な値ではないと判断される(ステップB7のNOルート参照)。 When the process target read response time deviates from the comparison source data in the direction of increasing by a predetermined threshold value (second threshold value) or more, the process target read response time suggests that some abnormality has occurred in the volume. It is determined that the read response time to be processed is not an appropriate value (see NO route in step B7).
そこで、ステップB8において、性能情報解析処理部52は、性能情報格納ファイル54から当該ボリュームのリードキャッシュヒット率を取得し、所定の閾値(第3閾値)と比較する(第2の比較処理)。
Therefore, in step B8, the performance information
ステップB9において、性能情報解析処理部52は、処理対象リードレスポンスタイムに対応するボリュームのリードキャッシュヒット率が妥当な値であるか否かを判断する。具体的には、性能情報解析処理部52は、リードキャッシュヒット率が第3閾値(80%)よりも大きいか否かを判断する。
In step B9, the performance information
リードキャッシュヒット率が第3閾値(80%)以下の場合には(ステップB9のNOルート参照)、性能情報解析処理部52は、当該リードキャッシュヒット率は妥当な値でないと判断し、ステップB10の処理に移行する。
When the read cache hit rate is equal to or less than the third threshold value (80%) (see the NO route in step B9), the performance information
ステップB10において、性能情報解析処理部52は、処理対象リードレスポンスタイムに対応するボリュームをランキングテーブル58に登録する。また、性能情報解析処理部52は、新たなボリュームが追加されたランキングテーブル58を、リードレスポンスタイムの第2閾値に対する乖離率が高いものから順に並び変える。その後、処理はステップB3に戻る。
In step B10, the performance information
一方、リードキャッシュヒット率が第3閾値(80%)よりも大きい場合には(ステップB9のYESルート参照)、性能情報解析処理部52は、当該リードキャッシュヒット率は妥当な値であると判断する。その場合、処理対象リードレスポンスタイムは、ステップB3に戻る。
On the other hand, when the read cache hit rate is larger than the third threshold value (80%) (see the YES route in step B9), the performance information
また、ステップB7における判断の結果、処理対象リードレスポンスタイムが、比較元データに対して、所定の閾値(第2閾値)以上増加する方向で乖離していない場合には、処理対象リードレスポンスタイムが妥当な値であると判断される(ステップB7のYESルート参照)。この場合にも、処理はステップB3に戻る。 Further, as a result of the determination in step B7, if the processing target read response time does not deviate from the comparison source data in the direction of increasing by a predetermined threshold value (second threshold value) or more, the processing target read response time is set. It is determined to be a reasonable value (see YES route in step B7). In this case as well, the process returns to step B3.
次に、実施形態の一例としてのストレージシステム1における、操作端末3へのランキングテーブル58の表示制御を図13に示すフローチャート(ステップD1〜D5)に従って説明する。
Next, the display control of the ranking table 58 on the
なお、図13に示すフローチャートにおいて、ステップD1,D2は操作端末3における処理を示し、ステップD3〜D5は管理サーバ5(性能情報解析処理部52)の処理を示す。
In the flowchart shown in FIG. 13, steps D1 and D2 show the processing in the
ステップD1において、ストレージ管理者は、操作端末3の入力装置を操作して、応答時間ランキングの出力を要求する入力を行なう。応答時間ランキングの出力要求は、管理サーバ10のストレージ管理部51に送信される。
In step D1, the storage administrator operates the input device of the
ステップD3において、ストレージ管理部51は、ランキングテーブル58を参照する。そして、ステップD4において、ストレージ管理部51はランキングテーブル58の上位(例えば、1位〜5位)に登録されたボリュームの情報(ランキング情報,乖離率ランキング)を抽出し、ストレージ管理者にメールで通知する。
In step D3, the
ステップD5において、ストレージ管理部51は、ランキング情報(乖離率ランキング)を用いてWeb GUIの表示データを生成し、操作端末3に応答する。
In step D5, the
ステップD2において、操作端末3は、ストレージ管理部51から受信したランキング情報の表示データをディスプレイに表示させ、処理を終了する。操作端末3を使用するストレージ管理者は、この乖離率ランキングを参照することで、性能問題が発生するおそれがあるボリュームを把握することができる。
In step D2, the
(C)効果
このように、実施形態の一例としてのストレージシステム1によれば、性能情報解析処理部52が、ストレージ装置4におけるボリュームのリードレスポンスタイム(性能データ)の実績値を用いて評価データテーブル57を作成する。評価データテーブル57は、直近の所定期間(上記実施形態では4週間分)のレスポンスタイムのデータを用いて、各曜日の各時間帯毎の性能データの平均値を算出することで構成されている。
(C) Effect As described above, according to the
また、性能情報解析処理部52は、ボリュームにおいて検出された処理対象リードレスポンスタイムを、評価データテーブル57における当該処理対象リードレスポンスタイムと時間条件が同一である比較元データと比較する第1の比較処理を行なう。
Further, the performance information
この第1の比較処理の結果、処理対象リードレスポンスタイムが比較元データに対して、第2閾値以上乖離している場合に、当該ボリュームにおいては、何らかの理由で処理の遅延が発生しており、運用上の問題が生じていると判断することができる。このように、第1の比較処理の結果、処理対象リードレスポンスタイムが比較元データに対して、第2閾値以上乖離しているボリュームの情報をストレージ管理者に通知することで、ストレージ管理者は、性能問題が発生するおそれがあるボリュームを容易に把握することができる。また、必要に応じて予防措置や、障害発生に対する備え等を行なうことができる。これにより、信頼性を向上させることができる。 As a result of this first comparison processing, when the processing target read response time deviates from the comparison source data by a second threshold value or more, a processing delay occurs in the volume for some reason. It can be determined that an operational problem has occurred. In this way, as a result of the first comparison process, the storage administrator can notify the storage administrator of the information of the volume whose process target read response time deviates from the comparison source data by the second threshold value or more. , Volumes that may cause performance problems can be easily grasped. In addition, preventive measures and preparations for the occurrence of a failure can be taken as necessary. This can improve reliability.
さらに、性能情報解析処理部52は、処理対象リードレスポンスタイムが比較元データに対して、第2閾値以上乖離している場合に、性能情報格納ファイル54から当該ボリュームのリードキャッシュヒット率を取得し、第3閾値と比較する第2の比較処理を行なう。
Further, the performance information
そして、性能情報解析処理部52は、リードキャッシュヒット率が第3閾値以下であると判断したボリュームをランキングテーブル58に登録する。ランキングテーブル58には、リードレスポンスタイムが比較元データに対して第2閾値以上乖離するほど増加しており、且つ、リードキャッシュヒット率が第3閾値以下となった複数のボリュームが示されている。また、これらの複数のボリュームは、リードレスポンスタイムの比較元データからの乖離率が高いものから順に並べられている。ストレージ管理部51は、ランキングテーブル58の上位(例えば、1位〜5位)に登録されたボリュームの情報を抽出し、ストレージ管理者に提示する。
Then, the performance information
ランキングテーブル58においては、上位にあるボリュームほど性能問題が発生するおそれがあると考えられる。従って、ストレージ管理者は、提示された情報を参照することで、性能問題が発生するおそれがあるボリュームを容易に把握することができ、必要に応じて予防措置や、障害発生に対する備え等を行なうことができる。これにより、信頼性を向上させることができる。 In the ranking table 58, it is considered that the higher the volume, the more the performance problem may occur. Therefore, the storage administrator can easily grasp the volume where the performance problem may occur by referring to the presented information, and take preventive measures and preparations for the occurrence of a failure as necessary. be able to. This can improve reliability.
性能情報解析処理部52は、処理対象リードレスポンスタイムが時間条件が同一である比較元データに対して、第1閾値以上乖離している異常データを検出した場合に、当該処理対象リードレスポンスタイムを破棄して性能データの作成に用いない。これにより、性能データの信頼性を向上させることができる。
When the performance information
また、性能情報解析処理部52は、処理対象リードレスポンスタイムが時間条件が同一である比較元データに対して、第1閾値以上乖離している異常データを検出した場合に、異常関連情報を含む異常通知をストレージ管理者に通知する。これにより、ストレージ管理者は、異常データの発生をリアルタイムに確認することができる。ストレージ管理者は、異常関連情報を参照することで、ストレージ装置4における異常データの発生原因を推定することができる。これにより、ストレージ管理者は、ストレージ装置4において実際に障害が発生する前に、予防措置や障害発生に対する備え等を行なうことができ、信頼性を向上させることができる。
Further, the performance information
また、性能情報解析処理部52は、乖離率ランキングの上位(例えば、1位〜5位)にランキングされた状態が所定回数(例えば、3回)以上、生じたボリュームについても、上述した異常関連情報と同様の情報をストレージ装置4から収集し、ストレージ管理者に対して通知する。
Further, the performance information
これによっても、ストレージ管理者は、異常関連情報を参照することで、ストレージ装置4における異常データの発生原因を推定することができる。これにより、ストレージ管理者は、ストレージ装置4において実際に障害が発生する前に、予防措置や障害発生に対する備え等を行なうことができ、信頼性を向上させることができる。
Also with this, the storage administrator can estimate the cause of the occurrence of the abnormal data in the
本ストレージシステム1においては、ストレージ装置4に備えられる性能管理機能が取得している性能情報のうち、ボリュームのリードレスポンスタイム(応答時間)とリードキャッシュヒット率に着目している。ストレージ装置4におけるリード処理において対象データがキャッシュ上にある場合、ストレージ42からデータを読み込むよりもレスポンスタイムは早くなる。
In the
リードキャッシュヒット率が高いにも関わらず、リードレスポンスタイムが通常より悪化している場合には、ストレージ装置4として何らかの問題が発生していることが想定される。そのため、この状態のボリュームに限定して情報を表示することで、業務影響の有無を確認すべき対象のボリュームを漏れなく確認することが可能になる。
If the read response time is worse than usual even though the read cache hit rate is high, it is assumed that some problem has occurred in the
なお、ストレージ42のI/O性能を示す情報として、I/Oのレスポンスタイム(応答時間)やIOPS(Input/Output Per Second:スループット値)があるが、IOPSは、I/Oの状態(リード/ライト比やアクセス状況のRandom/Sequentialなど)により値が大きく異なり、ボリュームの性能判断に用いるには好ましくない。そのため、本ストレージシステム1においては、定常的に業務影響を判断する指標としてはレスポンスタイム(応答時間)を採用する。
Information indicating the I / O performance of the
また、ストレージ装置4のキャッシュとしてはリードキャッシュとライトキャッシュとが備えられるが、ライト処理はライトキャッシュにライトデータを書き込んだ時点で完了となる。そのため、ボリュームの性能判断において、このようなライト処理のレスポンスタイムを除外することで業務影響の有無を判断するための精度を高めることができる。
Further, the cache of the
(D)その他
図14は実施形態の一例としての管理サーバ5のハードウェア構成を例示する図である。
管理サーバ5は、サーバ機能を備えた情報処理装置(コンピュータ)であって、例えば、プロセッサ11,メモリ12,記憶装置13,グラフィック処理装置14,入力インタフェース15,光学ドライブ装置16,機器接続インタフェース17およびネットワークインタフェース18を構成要素として有する。これらの構成要素11〜18は、バス19を介して相互に通信可能に構成される。
(D) Others FIG. 14 is a diagram illustrating a hardware configuration of the
The
プロセッサ(処理部)11は、管理サーバ5全体を制御する。プロセッサ11は、マルチプロセッサであってもよい。プロセッサ11は、例えばCPU,MPU(Micro Processing Unit),DSP(Digital Signal Processor),ASIC(Application Specific Integrated Circuit),PLD(Programmable Logic Device),FPGA(Field Programmable Gate Array)のいずれか一つであってもよい。また、プロセッサ11は、CPU,MPU,DSP,ASIC,PLD,FPGAのうちの2種類以上の要素の組み合わせであってもよい。
The processor (processing unit) 11 controls the
そして、プロセッサ11が管理サーバ5用の制御プログラム(ストレージ性能監視プログラム:図示省略)を実行することにより、図2に例示する、ストレージ管理部51および性能情報解析処理部52としての機能が実現される。
Then, by the
なお、管理サーバ5は、例えばコンピュータ読み取り可能な非一時的な記録媒体に記録されたプログラム(ストレージ性能監視プログラムやOS(Operating System)プログラム)を実行することにより、ストレージ管理部51および性能情報解析処理部52としての機能を実現する。
The
管理サーバ5に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、管理サーバ5に実行させるプログラムを記憶装置13に格納しておくことができる。プロセッサ11は、記憶装置13内のプログラムの少なくとも一部をメモリ(RAM)12にロードし、ロードしたプログラムを実行する。
The program that describes the processing content to be executed by the
また、管理サーバ5(プロセッサ11)に実行させるプログラムを、光ディスク16a,メモリ装置17a,メモリカード17c等の非一時的な可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ11からの制御により、記憶装置13にインストールされた後、実行可能になる。また、プロセッサ11が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。
Further, the program to be executed by the management server 5 (processor 11) can be recorded on a non-temporary portable recording medium such as an optical disk 16a, a
メモリ12は、ROMおよびRAMを含む記憶メモリである。メモリ12のRAMは管理サーバ5の主記憶装置として使用される。RAMには、プロセッサ11に実行させるOSプログラムや制御プログラムの少なくとも一部が一時的に格納される。また、メモリ12には、プロセッサ11による処理に必要な各種データが格納される。
The
記憶装置13は、ハードディスクドライブ(HDD)、SSD、SCM等の記憶装置であって、種々のデータを格納するものである。記憶装置13は、管理サーバ5の補助記憶装置として使用される。記憶装置13には、OSプログラム,制御プログラムおよび各種データが格納される。
The
なお、補助記憶装置としては、SCMやフラッシュメモリ等の半導体記憶装置を使用することもできる。また、複数の記憶装置13を用いてRAIDを構成してもよい。
As the auxiliary storage device, a semiconductor storage device such as an SCM or a flash memory can also be used. Further, the RAID may be configured by using a plurality of
また、記憶装置13には、性能情報格納ファイル54,解析処理設定情報55,1Hデータ格納テーブル56,評価データテーブル57,ランキングテーブル58およびログ情報59を構成するデータが格納される。
Further, the
グラフィック処理装置14には、モニタ14aが接続されている。グラフィック処理装置14は、プロセッサ11からの命令に従って、画像をモニタ14aの画面に表示させる。モニタ14aとしては、CRT(Cathode Ray Tube)を用いた表示装置や液晶表示装置等が挙げられる。
A
入力インタフェース15には、キーボード15aおよびマウス15bが接続されている。入力インタフェース15は、キーボード15aやマウス15bから送られてくる信号をプロセッサ11に送信する。なお、マウス15bは、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル,タブレット,タッチパッド,トラックボール等が挙げられる。
A
光学ドライブ装置16は、レーザ光等を利用して、光ディスク16aに記録されたデータの読み取りを行なう。光ディスク16aは、光の反射によって読み取り可能にデータを記録された可搬型の非一時的な記録媒体である。光ディスク16aには、DVD(Digital Versatile Disc),DVD−RAM,CD−ROM(Compact Disc Read Only Memory),CD−R(Recordable)/RW(ReWritable)等が挙げられる。
The
機器接続インタフェース17は、管理サーバ5に周辺機器を接続するための通信インタフェースである。例えば、機器接続インタフェース17には、メモリ装置17aやメモリリーダライタ17bを接続することができる。メモリ装置17aは、機器接続インタフェース17との通信機能を搭載した非一時的な記録媒体、例えばUSB(Universal Serial Bus)メモリである。メモリリーダライタ17bは、メモリカード17cへのデータの書き込み、またはメモリカード17cからのデータの読み出しを行なう。メモリカード17cは、カード型の非一時的な記録媒体である。
The
ネットワークインタフェース18は、ネットワークに接続される。ネットワークインタフェース18は、ネットワークを介して、操作端末3はストレージ装置4との間でデータの送受信を行なう。ネットワークには他の情報処理装置や通信機器等が接続されてもよい。
The
そして、開示の技術は上述した実施形態に限定されるものではなく、本実施形態の趣旨を逸脱しない範囲で種々変形して実施することができる。本実施形態の各構成および各処理は、必要に応じて取捨選択することができ、あるいは適宜組み合わせてもよい。 The disclosed technique is not limited to the above-described embodiment, and can be variously modified and implemented without departing from the spirit of the present embodiment. Each configuration and each process of the present embodiment can be selected as necessary, or may be combined as appropriate.
例えば、上述した実施形態においては、評価データテーブル57およびランキングテーブル58がそれぞれテーブルとしてのフォーマットを有しているが、これに限定されるものではなく、データのフォーマットは適宜変更して実施することができる。 For example, in the above-described embodiment, the evaluation data table 57 and the ranking table 58 each have a format as a table, but the present invention is not limited to this, and the data format is appropriately changed. Can be done.
また、上述した実施形態においては、ストレージシステム1に1つのストレージ装置4が備えられているが、これに限定されるものではなく、2つ以上のストレージ装置4を備えてもよい。
Further, in the above-described embodiment, the
また、上述した実施形態においては、ストレージシステム1に1つの管理サーバ5を備え、この管理サーバ5にストレージ管理部51,性能情報解析処理部52および記憶部53としての機能を備えているが、これに限定されるものではない。複数の管理サーバ5を備え、これらの複数の管理サーバ5にストレージ管理部51,性能情報解析処理部52および記憶部53としての機能を分散して備えてもよい。
また、上述した開示により本実施形態を当業者によって実施・製造することが可能である。
Further, in the above-described embodiment, the
Further, according to the above-mentioned disclosure, it is possible to carry out and manufacture this embodiment by a person skilled in the art.
(E)付記
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
ストレージ装置が管理する複数のボリュームの性能を監視するストレージ性能監視装置であって、
前記複数のボリュームのそれぞれの第1リード性能情報に基づいて、ボリューム毎に、所定期間毎の性能比較値を求める性能比較値作成部と、
前記複数のボリュームのそれぞれについて、最新の第1リード性能情報を前記性能比較値と比較し、前記最新の第1リード性能情報が比較元データに対して第1リード性能閾値(第2閾値)以上乖離していると判定されたボリュームを抽出するボリューム抽出部と、
前記抽出したボリュームを表す通知を出力する出力部と
を備えることを特徴とする、ストレージ性能監視装置。
(E) Additional notes The following additional notes will be further disclosed with respect to the above embodiments.
(Appendix 1)
A storage performance monitoring device that monitors the performance of multiple volumes managed by the storage device.
A performance comparison value creating unit that obtains a performance comparison value for each predetermined period for each volume based on the first read performance information of each of the plurality of volumes.
For each of the plurality of volumes, the latest first read performance information is compared with the performance comparison value, and the latest first read performance information is equal to or higher than the first read performance threshold (second threshold) with respect to the comparison source data. A volume extraction unit that extracts volumes that are determined to be divergent,
A storage performance monitoring device including an output unit that outputs a notification representing the extracted volume.
(付記2)
前記ボリューム抽出部が、前記最新の第1リード性能情報が比較元データに対して前記第1リード性能閾値以上乖離していると判定され、且つ、第2リード性能情報が第2リード性能閾値以下のボリュームを抽出する
ことを特徴とする、付記1記載のストレージ性能監視装置。
(Appendix 2)
The volume extraction unit determines that the latest first read performance information deviates from the comparison source data by the first read performance threshold value or more, and the second read performance information is equal to or less than the second read performance threshold value. The storage performance monitoring device according to
(付記3)
前記ボリューム抽出部が、最新の第1リード性能情報を、当該第1リード性能情報と時間条件が同一の前記性能比較値と比較する
ことを特徴とする、付記1または2記載のストレージ性能監視装置。
(Appendix 3)
The storage performance monitoring device according to
(付記4)
前記第1リード性能情報が当該第1リード性能情報と時間条件が同一の前記性能比較値と異常判断閾値以上乖離している場合に、前記出力部が、当該第1リード性能情報と同一タイミングで、同一ボリュームから収集された異常関連情報を出力する
ことを特徴とする、付記1〜3のいずれか1項に記載のストレージ性能監視装置。
(Appendix 4)
When the first read performance information deviates from the performance comparison value having the same time condition as the first read performance information by an abnormality determination threshold value or more, the output unit performs the same timing as the first read performance information. The storage performance monitoring device according to any one of
(付記5)
前記ボリューム抽出部が、2つ以上の前記ボリュームを抽出し、
前記出力部が、抽出された前記2つ以上のボリュームに、比較元データに対する第1リード性能閾値の乖離率に応じたランキングを設定して出力する
ことを特徴とする、付記1〜4のいずれか1項に記載のストレージ性能監視装置。
(Appendix 5)
The volume extraction unit extracts two or more of the volumes,
Any of the
(付記6)
前記ランキングにおける所定順位以上に同一のボリュームが所定回数以上設定された場合に、前記出力部が、当該ボリュームから収集された異常関連情報を出力する
ことを特徴とする、付記5記載のストレージ性能監視装置。
(Appendix 6)
The storage performance monitoring according to
(付記7)
ストレージ装置が管理する複数のボリュームの性能を監視するストレージ性能監視装置のプロセッサに、
前記複数のボリュームのそれぞれの第1リード性能情報に基づいて、ボリューム毎に、所定期間毎の性能比較値を求め、
前記複数のボリュームのそれぞれについて、最新の第1リード性能情報を前記性能比較値と比較し、前記最新の第1リード性能情報が比較元データに対して第1リード性能閾値以上乖離していると判定されたボリュームを抽出し、
前記抽出したボリュームを表す通知を出力する
処理を実行させる、ストレージ性能監視プログラム。
(Appendix 7)
For the processor of the storage performance monitoring device that monitors the performance of multiple volumes managed by the storage device,
Based on the first read performance information of each of the plurality of volumes, the performance comparison value for each predetermined period is obtained for each volume.
For each of the plurality of volumes, the latest first read performance information is compared with the performance comparison value, and the latest first read performance information deviates from the comparison source data by the first read performance threshold value or more. Extract the determined volume and
A storage performance monitoring program that executes a process that outputs a notification representing the extracted volume.
(付記8)
前記最新の第1リード性能情報が比較元データに対して前記第1リード性能閾値以上乖離していると判定され、且つ、第2リード性能情報が第2リード性能閾値以下のボリュームを抽出する
処理を前記プロセッサに実行させる、付記7記載のストレージ性能監視プログラム。
(Appendix 8)
A process of extracting a volume in which the latest first read performance information is determined to deviate from the comparison source data by the first read performance threshold value or more and the second read performance information is equal to or less than the second read performance threshold value. 7. The storage performance monitoring program according to Appendix 7, which causes the processor to execute the above.
(付記9)
最新の第1リード性能情報を、当該第1リード性能情報と時間条件が同一の前記性能比較値と比較する
処理を、前記プロセッサに実行させる、付記7または8記載のストレージ性能監視プログラム。
(Appendix 9)
The storage performance monitoring program according to
(付記10)
前記第1リード性能情報が当該第1リード性能情報と時間条件が同一の前記性能比較値と異常判断閾値以上乖離している場合に、当該第1リード性能情報と同一タイミングで、同一ボリュームから収集された異常関連情報を出力する
処理を、前記プロセッサに実行させる、付記7〜9のいずれか1項に記載のストレージ性能監視プログラム。
(Appendix 10)
When the first read performance information deviates from the performance comparison value having the same time condition as the first read performance information by an abnormality determination threshold value or more, it is collected from the same volume at the same timing as the first read performance information. The storage performance monitoring program according to any one of Supplementary note 7 to 9, which causes the processor to execute a process of outputting the abnormal abnormality-related information.
(付記11)
2つ以上の前記ボリュームを抽出し、
抽出された前記2つ以上のボリュームに、比較元データに対する第1リード性能閾値の乖離率に応じたランキングを設定して出力する
処理を、前記プロセッサに実行させる、付記7〜10のいずれか1項に記載のストレージ性能監視プログラム。
(Appendix 11)
Extract two or more of the volumes and
Any one of Supplementary note 7 to 10, which causes the processor to execute a process of setting and outputting a ranking according to the deviation rate of the first read performance threshold value with respect to the comparison source data to the two or more extracted volumes. The storage performance monitoring program described in Section.
(付記12)
前記ランキングにおける所定順位以上に同一のボリュームが所定回数以上設定された場合に、当該ボリュームから収集された異常関連情報を出力する
処理を、前記プロセッサに実行させる、付記11記載のストレージ性能監視プログラム。
(Appendix 12)
The storage performance monitoring program according to
1 ストレージシステム
2 通信回線
3 操作端末
4 ストレージ装置
5 管理サーバ
11 プロセッサ
12 RAM
13 HDD
14 グラフィック処理装置
14a モニタ
15 入力インタフェース
15a キーボード
15b マウス
16 光学ドライブ装置
16a 光ディスク
17 機器接続インタフェース
17a メモリ装置
17b メモリリーダライタ
17c メモリカード
18 ネットワークインタフェース
19 バス
41 CM
42 ストレージ
51 ストレージ管理部
52 性能情報解析処理部
53 記憶部
54 性能情報格納ファイル
55 解析処理設定情報
56 1Hデータ格納テーブル
57 評価データテーブル
58 ランキングテーブル
59 ログ情報
1
13 HDD
14
42
Claims (7)
前記複数のボリュームのそれぞれの第1リード性能情報に基づいて、ボリューム毎に、所定期間毎の性能比較値を求める性能比較値作成部と、
前記複数のボリュームのそれぞれについて、最新の第1リード性能情報を前記性能比較値と比較し、前記最新の第1リード性能情報が比較元データに対して第1リード性能閾値以上乖離していると判定されたボリュームを抽出するボリューム抽出部と、
前記抽出したボリュームを表す通知を出力する出力部と
を備えることを特徴とする、ストレージ性能監視装置。 A storage performance monitoring device that monitors the performance of multiple volumes managed by the storage device.
A performance comparison value creating unit that obtains a performance comparison value for each predetermined period for each volume based on the first read performance information of each of the plurality of volumes.
For each of the plurality of volumes, the latest first read performance information is compared with the performance comparison value, and the latest first read performance information deviates from the comparison source data by the first read performance threshold value or more. A volume extractor that extracts the determined volume, and
A storage performance monitoring device including an output unit that outputs a notification representing the extracted volume.
ことを特徴とする、請求項1記載のストレージ性能監視装置。 The volume extraction unit determines that the latest first read performance information deviates from the comparison source data by a predetermined threshold value or more, and extracts a volume whose second read performance information is equal to or less than the second read performance threshold value. The storage performance monitoring device according to claim 1, wherein the storage performance monitoring device is characterized by the above.
ことを特徴とする、請求項1または2記載のストレージ性能監視装置。 The storage performance monitoring according to claim 1 or 2, wherein the volume extraction unit compares the latest first read performance information with the performance comparison value having the same time condition as the first read performance information. Device.
ことを特徴とする、請求項1〜3のいずれか1項に記載のストレージ性能監視装置。 When the first read performance information deviates from the performance comparison value having the same time condition as the first read performance information by an abnormality determination threshold value or more, the output unit performs the same timing as the first read performance information. The storage performance monitoring device according to any one of claims 1 to 3, wherein the abnormality-related information collected from the same volume is output.
前記出力部が、抽出された前記2つ以上のボリュームに、比較元データに対する第1リード性能閾値の乖離率に応じたランキングを設定して出力する
ことを特徴とする、請求項1〜4のいずれか1項に記載のストレージ性能監視装置。 The volume extraction unit extracts two or more of the volumes,
The first to fourth aspects of the present invention, wherein the output unit sets and outputs a ranking according to the deviation rate of the first read performance threshold value with respect to the comparison source data to the two or more extracted volumes. The storage performance monitoring device according to any one of the items.
ことを特徴とする、請求項5記載のストレージ性能監視装置。 The storage performance according to claim 5, wherein when the same volume is set a predetermined number of times or more in a predetermined order or higher in the ranking, the output unit outputs the abnormality-related information collected from the volume. Monitoring device.
前記複数のボリュームのそれぞれの第1リード性能情報に基づいて、ボリューム毎に、所定期間毎の性能比較値を求め、
前記複数のボリュームのそれぞれについて、最新の第1リード性能情報を前記性能比較値と比較し、前記最新の第1リード性能情報が比較元データに対して第1リード性能閾値以上乖離していると判定されたボリュームを抽出し、
前記抽出したボリュームを表す通知を出力する
処理を実行させる、ストレージ性能監視プログラム。
For the processor of the storage performance monitoring device that monitors the performance of multiple volumes managed by the storage device,
Based on the first read performance information of each of the plurality of volumes, the performance comparison value for each predetermined period is obtained for each volume.
For each of the plurality of volumes, the latest first read performance information is compared with the performance comparison value, and the latest first read performance information deviates from the comparison source data by the first read performance threshold value or more. Extract the determined volume and
A storage performance monitoring program that executes a process that outputs a notification representing the extracted volume.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020097643A JP2021190000A (en) | 2020-06-04 | 2020-06-04 | Storage performance monitoring device and storage performance monitoring program |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2020097643A JP2021190000A (en) | 2020-06-04 | 2020-06-04 | Storage performance monitoring device and storage performance monitoring program |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2021190000A true JP2021190000A (en) | 2021-12-13 |
Family
ID=78849666
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2020097643A Pending JP2021190000A (en) | 2020-06-04 | 2020-06-04 | Storage performance monitoring device and storage performance monitoring program |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2021190000A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116775598A (en) * | 2023-05-23 | 2023-09-19 | 阿里云计算有限公司 | Data table performance detection method, system, computing device and computer readable storage medium |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001142746A (en) * | 1999-11-11 | 2001-05-25 | Nec Software Chubu Ltd | Load monitor device for computer system |
| JP2005062941A (en) * | 2003-08-12 | 2005-03-10 | Hitachi Ltd | Performance information analysis method |
| JP2005182274A (en) * | 2003-12-17 | 2005-07-07 | Hitachi Ltd | Computer system management program, recording medium, computer system management system, management device and storage device therefor |
| JP2011216052A (en) * | 2010-04-02 | 2011-10-27 | Hitachi Ltd | Management system and computer system management method |
| JP2017129983A (en) * | 2016-01-19 | 2017-07-27 | 日本電信電話株式会社 | Alarm information display device, alarm information display program, and alarm information display method |
| JP2018190055A (en) * | 2017-04-28 | 2018-11-29 | 富士通株式会社 | Storage controller, storage control program and storage control method |
-
2020
- 2020-06-04 JP JP2020097643A patent/JP2021190000A/en active Pending
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001142746A (en) * | 1999-11-11 | 2001-05-25 | Nec Software Chubu Ltd | Load monitor device for computer system |
| JP2005062941A (en) * | 2003-08-12 | 2005-03-10 | Hitachi Ltd | Performance information analysis method |
| JP2005182274A (en) * | 2003-12-17 | 2005-07-07 | Hitachi Ltd | Computer system management program, recording medium, computer system management system, management device and storage device therefor |
| JP2011216052A (en) * | 2010-04-02 | 2011-10-27 | Hitachi Ltd | Management system and computer system management method |
| JP2017129983A (en) * | 2016-01-19 | 2017-07-27 | 日本電信電話株式会社 | Alarm information display device, alarm information display program, and alarm information display method |
| JP2018190055A (en) * | 2017-04-28 | 2018-11-29 | 富士通株式会社 | Storage controller, storage control program and storage control method |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| CN116775598A (en) * | 2023-05-23 | 2023-09-19 | 阿里云计算有限公司 | Data table performance detection method, system, computing device and computer readable storage medium |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5423904B2 (en) | Information processing apparatus, message extraction method, and message extraction program | |
| US7856575B2 (en) | Collaborative troubleshooting computer systems using fault tree analysis | |
| US10303533B1 (en) | Real-time log analysis service for integrating external event data with log data for use in root cause analysis | |
| US10868744B2 (en) | Influence range identification method and influence range identification apparatus | |
| US20160378583A1 (en) | Management computer and method for evaluating performance threshold value | |
| US20120150925A1 (en) | Proactive Method for Improved Reliability for Sustained Persistence of Immutable Files in Storage Clouds | |
| US11113163B2 (en) | Storage array drive recovery | |
| US7849058B2 (en) | Storage system determining execution of backup of data according to quality of WAN | |
| US11449376B2 (en) | Method of determining potential anomaly of memory device | |
| US11762720B2 (en) | Information processing apparatus and non-transitory computer-readable storage medium for storing API use history display program | |
| JP6369235B2 (en) | Storage control device and storage control program | |
| US9576061B2 (en) | Information processing system and data update control method | |
| US10783042B2 (en) | System and method of assessing and managing storage device degradation | |
| US11314600B2 (en) | Data placement method based on health scores | |
| US20150127985A1 (en) | Information processing apparatus and access control method | |
| CN102959521B (en) | Computer system management method and management system | |
| JP2019053474A (en) | Data protection method for cloud-based services | |
| US9021078B2 (en) | Management method and management system | |
| JP2021190000A (en) | Storage performance monitoring device and storage performance monitoring program | |
| JP5623950B2 (en) | IT failure sign detection device and program | |
| JPWO2018061136A1 (en) | Demand forecasting method, demand forecasting system and program thereof | |
| JP7694341B2 (en) | Determination program, determination method, and information processing device | |
| EP3547139B1 (en) | System and method of assessing and managing storage device degradation | |
| JP2022140929A (en) | Information processing program, information processing method, and information processing device | |
| US20250220025A1 (en) | Computer-implemented method for gathering usable information from an unreliable data source and related system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20230309 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20231228 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20240130 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20240327 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20240327 |
|
| A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20240702 |
|
| A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A712 Effective date: 20240906 |
|
| RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20240910 |
|
| RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20240910 |
|
| RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20241018 |