CN107888405B

CN107888405B - 管理设备和信息处理系统

Info

Publication number: CN107888405B
Application number: CN201710881230.7A
Authority: CN
Inventors: 日比野哲也
Original assignee: Fujitsu Ltd
Current assignee: Fusas Technology Co ltd
Priority date: 2016-09-29
Filing date: 2017-09-26
Publication date: 2021-04-13
Anticipated expiration: 2037-09-26
Also published as: JP6810341B2; CN107888405A; JP2018055467A; US20180091357A1; US10659285B2

Abstract

管理设备和信息处理系统。存储单元存储指示与信息处理设备有关的组件的状态的管理信息。在接收到信息处理设备的状态变化的通知时，处理单元响应于该通知确定是否查询指示组件的当前状态的组件信息。当确定查询组件信息时，处理单元从多个组件选择一个或更多个查询目标组件，获取所选查询目标组件的组件信息，并且基于组件信息更新存储单元中存储的管理信息。

Description

管理设备和信息处理系统

技术领域

这里讨论的实施方式涉及管理设备和信息处理系统。

背景技术

在近来的信息处理系统中，多个种类的设备(例如，存储设备、交换机、服务器计算机等)连接到网络并且运行。随着系统规模增大，运行的设备的数量也增大，这使操作管理繁重。由此，使用支持这种信息处理系统的操作管理的管理设备。

例如，已经提出了一种连接到包括存储系统、服务器和交换机的存储网络的网络管理器。网络管理器包括对应于多个供应商的产品的事件辞典，并且使用事件辞典来解释从发生故障的装置接收的事件消息。

还提出了一种存储区域网络(SAN)管理器，其解释从SAN上的各个设备接收的故障通知消息。SAN管理器检测故障对实际容量或虚拟容量的影响。

还提出了一种管理服务器，其接收从各个主计算机中的代理和各个硬件设备中的属性信息通知单元发送的信息。管理服务器通过以唯一数据结构使多段信息彼此关联，集中管理从多个设备发送的多段信息。

参见例如日本特开专利第2004-133897号、第2007-172003号和第2007-257645号公报。

一种信息处理设备包括多个组件，诸如处理装置、存储装置、通信接口等。这些组件的状态可以响应于故障等变化。处理该变化的一种方法可以是使管理设备周期性地收集关于系统中存在的所有组件的信息，并且登记和集中管理所收集的信息，作为管理信息。然而，在平时，例如，要收集的信息与之前收集到的信息之间可能没有差异。即，管理设备可能执行不需要的信息收集。

另一种方法可以是例如使管理设备通知系统管理者发生了错误，并且响应于来自管理者的收集指令的输入来收集关于所有组件的信息。然而，凭借该方法，虽然仅在有限情况下执行信息收集，但由管理者作出是否收集信息的确定。因此，除非管理者发出指令，否则不更新管理信息，这可能降低管理信息的精度。

发明内容

在实施方式的一个方面中，目的是提高管理信息的精度。

根据一个方面，提供了一种管理设备，所述管理设备包括；存储单元，其存储指示与信息处理设备有关的组件的状态的管理信息；以及处理单元，其在接收到所述信息处理设备的状态变化的通知时，响应于所述通知，确定是否查询指示所述组件的当前状态的组件信息，并且当确定查询组件信息时，从所述多个组件选择一个或更多个查询目标组件，获取所选查询目标组件的所述组件信息，并且基于该组件信息来更新所述存储单元中存储的所述管理信息。

附图说明

图1例示了根据第一实施方式的管理设备；

图2例示了根据第二实施方式的信息处理系统的示例；

图3例示了根据第二实施方式的管理服务器的硬件的示例；

图4例示了根据第二实施方式的存储设备的硬件的示例；

图5例示了根据第二实施方式的光纤通道交换机的硬件的示例；

图6例示了根据第二实施方式的功能的示例；

图7例示了根据第二实施方式的管理表的示例；

图8例示了根据第二实施方式的连接表的示例；

图9例示了根据第二实施方式的连接状态的示例；

图10例示了根据第二实施方式的陷阱类型列表；

图11是例示了根据第二实施方式的管理服务器所执行的处理的示例的流程图；

图12是例示了根据第二实施方式的储存器所执行的处理的示例的流程图；

图13例示了根据第三实施方式的功能的示例；

图14例示了根据第三实施方式的计数器管理表的示例；

图15是例示了根据第三实施方式的管理服务器所执行的处理的示例的流程图；

图16是例示了根据第三实施方式的储存器进行的计数器更新的示例的流程图；

图17是例示了根据第三实施方式的储存器进行的设备信息发送的示例的流程图；

图18例示了根据第四实施方式的状态管理表的示例；

图19是例示了根据第四实施方式的管理服务器所执行的处理的示例的流程图；

图20是例示了根据第四实施方式的储存器所执行的处理的示例的流程图；以及

图21例示了根据第五实施方式的功能的示例。

具体实施方式

下面将参照附图描述多个实施方式，其中，相同的附图标记通篇指代相同的元件。

(a)第一实施方式

图1例示了根据第一实施方式的管理设备1。管理设备1执行信息处理设备2和3的操作管理。管理设备1和信息处理设备2和3连接到网络4。信息处理设备2和3可以是例如存储设备、服务器计算机、交换机等。

管理设备1包括存储单元1a和处理单元1b。存储单元1a可以是易失性存储装置，诸如随机存取存储器(RAM)等，或者可以是非易失性存储装置，诸如硬盘驱动器(HDD)、闪存等。处理单元1b可以包括中央处理单元(CPU)、数字信号处理器(DSP)、专用应用集成电路(ASIC)、场可编程门阵列(FPGA)等。处理单元1b可以是执行程序的处理器。“处理器”可以是一组处理器(多处理器)。管理设备1可以是包括存储器(存储单元1a)和处理器(处理单元1b)的计算机。

信息处理设备2包括存储单元2a、处理单元2b和组件2c、2d、2e和2f。信息处理设备3包括存储单元3a、处理单元3b和组件3c和3d。类似于存储单元1a，存储单元2a和3a中的每一个可以是RAM或HDD。类似于处理单元1b，处理单元2b和3b中的每一个可以是诸如CPU等的处理器。组件组g1是包括组件2c、2d、2e和2f的组件集合。组件组g2是包括组件3c和3d的组件集合。

组件2c、2d、2e和2f是实现信息处理设备2的预定功能的硬件，并且可以是例如处理装置、存储装置、通信接口等。例如，组件2c、2d、2e和2f经由信息处理设备2的内部总线连接到处理单元2b。类似地，组件3c和3d是实现信息处理设备3的预定功能的硬件。例如，组件3c和3d经由信息处理设备3的内部总线连接到处理单元3b。在图1的示例中，组件2d和3c是在信息处理设备2与3之间建立通信路径的通信接口。组件2d和3c与预定线缆连接。组件2c、2e和2f可以是由信息处理设备2执行的软件模块。类似地，组件3d可以是由信息处理设备3执行的软件模块。

存储单元1a存储包括关于组件2c、2d、2e、2f、3c和3d中的每一个的状态的信息的管理信息。组件2c、2d、2e和2f包括在信息处理设备2中，因此是与信息处理设备2有关的组件。组件3c和3d包括在用线缆连接到信息处理设备2的信息处理设备中，因此是与信息处理设备2有关的组件。例如，可以存在这样的情况：信息处理设备3是中继设备，诸如中继信息处理设备2的通信的交换机等，并且与信息处理设备2通信的另一个信息处理设备(图1中未例示)连接到中继设备。在这种情况下，另一个信息处理设备中包括的组件可以被认为是与信息处理设备2有关的组件。

除了信息处理设备2和3的状态之外，处理单元1b管理组件2c、2d、2e、2f、3c和3d的状态。处理单元1b在存储单元1a中存储关于组件2c、2d、2e、2f、3c和3d的管理信息。

信息处理设备2的状态可以包括以下状态：信息处理设备2处于正常状态(正常状态)；信息处理设备2发生错误(错误状态)；信息处理设备2已经从故障恢复(从故障恢复)；对信息处理设备2的维护工作已经完成(维护完成)等。上述情况也适用于信息处理设备3。

进一步地，组件2c的状态可以包括以下状态：组件2c处于正常状态；已经在组件2c中发布警告；组件2c发生错误；组件2c无法与其它设备通信等。上述情况也适用于组件2d、2e、2f、3c和3d。

处理单元1b从信息处理设备2接收信息处理设备2的状态变化的通知。在接收到信息处理设备2的状态变化的通知时，处理单元1b响应于该通知，确定是否查询关于组件2c、2d、2e、2f、3c和3d的组件信息。组件信息是指示各个组件的当前状态的信息(包括关于各个组件的硬件的信息)。例如，如果组件是HDD，则组件信息可以包括HDD的识别名称、总存储容量、所使用的容量、可用容量、正常或错误、接入负荷等。进一步地，例如，如果组件是通信接口，则组件信息可以包括通信接口的识别名称、链路状态(链路连接、链路断开等)、通信负荷等。

例如，信息处理设备2的状态变化(处理单元1b响应于该状态变化确定查询组件信息)可以包括以下状态变化。第一个是从正常状态到错误状态的变化。第二个是从错误状态到从故障恢复的变化。第三个是从正常状态到维护完成的变化。在所有这些情况下，由信息处理设备2通知的状态变化可能由组件中的一个的状态变化造成。

处理单元1b响应于其确定不查询组件信息的状态变化可以包括以下状态变化。第一个是从故障恢复到正常状态的变化。第二个是从维护完成到正常状态的变化。在这两种情况下，组件的状态不太可能变化。

如果确定查询组件信息，则处理单元1b根据信息处理设备2的状态变化的通知，从组件2c、2d、2e、2f、3c和3d选择一个或更多个查询目标组件。

例如，如果通知的内容指示只影响信息处理设备2而不影响信息处理设备3的故障，或者指示从故障恢复，则处理单元1b从组件2c、2d、2e、2f、3c和3d选择组件2c、2d、2e和2f，作为查询目标。

可能存在这种情况：通知的内容指示与信息处理设备2的一个或一些组件有关的维护(例如，替换HDD等)。在这种情况下，处理单元1b可以从组件2c、2d、2e和2f选择感兴趣组件(例如，仅组件2e)、或与感兴趣组件相同类型的多个组件(例如，仅组件2e和2f)，作为查询目标。

如果通知的内容指示故障或从故障恢复，该故障不仅影响信息处理设备2还影响信息处理设备3，则处理单元1b可以选择所有组件2c、2d、2e、2f、3c和3d，作为查询目标。而且，在这种情况下，处理单元1b可以根据通知的内容减少查询目标。

例如，关于信息处理设备3，处理单元1b可以从组件3c和3d选择用于与信息处理设备2通信和合作的组件3c，作为查询目标。即，处理单元1b可以选择组件2c、2d、2e和3c，作为查询目标。另选地，在通知的内容指示与信息处理设备3的通信有关的错误的情况下，处理单元1b可能进一步减少查询目标。在这种情况下，例如，处理单元1b通过从组件2c、2d、2e、2f、3c和3d选择组件2d和3c，可以减少查询目标。

处理单元1b获取所选查询目标组件的组件信息。例如，考虑组件2c、2d、2e、2f、3c和3d是查询目标组件的情况。

在这种情况下，处理单元1b向处理单元2b请求组件2c、2d、2e和2f的组件信息。处理单元2b向处理单元1b发送组件2c、2d、2e和2f的组件信息。处理单元2b可以提前获取组件2c、2d、2e和2f的组件信息，在存储单元2a中存储组件信息，响应于来自处理单元1b的请求从存储单元2a读取组件信息，并且对处理单元1b进行响应。另选地，在组件2c、2d、2e和2f中的每一个在其内部存储器中存储组件信息的情况下，处理单元2b响应于来自处理单元1b的请求，可以从组件2c、2d、2e和2f中的每一个读取组件信息，并且对处理单元1b进行响应。

处理单元1b还向处理单元3b请求组件3c和3d的组件信息。类似于处理单元2b，处理单元3b向处理单元1b返回组件3c和3d的组件信息。

处理单元1b基于所获取的组件信息来更新存储单元1a中存储的管理信息。例如，处理单元1b在管理信息中反映管理信息中登记的组件2c、2d、2e、2f、3c和3d的状态与此时获取的组件信息所指示的组件2c、2d、2e、2f、3c和3d的状态之间的差异。

以上述方式，根据管理设备1，响应于信息处理设备2的状态变化的通知，管理设备1自主获取各个组件的组件信息，并且更新管理信息。由此，可以提高管理信息的精度。以下描述对于此的具体方法。

一种方法可以是例如使管理设备1周期性地收集关于所有组件(组件2c、2d、2e、2f、3c和3d)的信息。然而，要收集的信息与之前信息之间可能没有差异，并且可能执行不需要的信息收集。不需要的信息收集增加了通信量。进一步地，随着收集信息的组件的数量增多，通信量增大。

另一种方法可以是使管理设备1通知系统管理者发生了错误，并且响应于来自管理者的收集指令的输入来收集关于所有组件的信息。然而，凭借该方法，由管理者作出是否收集信息的确定。因此，除非管理者发出指令，否则不更新管理信息，这可能降低管理信息的精度。

鉴于上述，管理设备1接收信息处理设备2的状态变化的通知，并且响应于该通知来确定是否收集信息。更具体地，如上所述，如果基于该通知确定组件的状态可能已经变化，则管理设备1确定收集组件信息。另一方面，如果确定组件的状态不太可能变化，则管理设备1确定不收集组件信息。这防止由管理设备1进行不需要的信息收集。进一步地，管理设备1在由管理设备1确定的合适时间收集信息，并且更新管理信息。因此，与管理者确定何时收集信息的情况相比，可以提高管理信息的精度。

进一步地，管理设备1根据通知从系统中包括的多个组件选择一个或更多个查询目标组件。因此，与所有组件总是被选为查询目标组件的情况相比，可以防止不需要的信息收集，并且防止增加通信量。由此，根据管理设备1，可以有效提高管理信息的精度。

在从信息处理设备3接收到状态变化通知的情况下，管理设备1以如上所述相同的方式确定是否收集组件信息，选择一个或更多个查询目标组件，获取所选查询目标组件的组件信息，并且更新管理信息。

在下文中，管理设备1的操作管理功能将基于管理设备1应用于包括存储设备的信息处理系统的示例被详细描述。

(b)第二实施方式

图2例示了根据第二实施方式的信息处理系统的示例。第二实施方式的信息处理系统包括管理服务器100、存储设备200、光纤通道交换机300、业务服务器400和终端设备500。管理服务器100、存储设备200、光纤通道交换机300、业务服务器400和终端设备500连接到网络10。网络10是例如用于操作管理的局域网(LAN)。存储设备200和业务服务器400连接到光纤通道交换机300。

管理服务器100是执行存储设备200、光纤通道交换机300和业务服务器400的操作管理的服务器计算机。存储设备200、光纤通道交换机300和业务服务器400中的每一个包括各种组件。管理服务器100从存储设备200、光纤通道交换机300和业务服务器400中的每一个收集关于组件的信息，并且集中管理信息。管理服务器100充当网络服务器，并且向终端设备500提供包括组件的状态的管理画面。

存储设备200包括多个存储装置，诸如HDD、固态驱动器(SSD)等。存储设备200使用多个存储装置利用廉价冗余磁盘阵列(RAID)技术构建逻辑存储区域，并且向业务服务器400提供存储区域。存储设备200经由光纤通道交换机300，接收根据光纤通道协议对业务服务器400的存储区域的访问。要注意的是，“存储设备”可以简称为“储存器”。

光纤通道交换机300是用于光纤通道的光纤连接的中继设备。即，光纤通道交换机300与连接到其的存储设备200和业务服务器400一起形成SAN。除了存储设备200和业务服务器400之外，多个存储设备、服务器计算机和其它光纤通道交换机可以连接到光纤通道交换机300。

业务服务器400是支持用户的业务的服务器计算机。业务服务器400执行预定业务处理。业务服务器400向存储设备200写入数据，并且从存储设备200读取数据，以用于业务处理。

终端设备500是由执行信息处理系统的操作管理的管理者使用的客户端计算机。终端设备500充当网络浏览器，并且向管理者呈现由管理服务器100提供的管理画面。

管理服务器100是第一实施方式的管理设备1的示例。存储设备200、光纤通道交换机300和业务服务器400是第一实施方式的信息处理设备2和3的示例。

图3例示了根据第二实施方式的管理服务器100的硬件的示例。管理服务器100包括处理器101、RAM 102、HDD 103、图像信号处理单元104、输入信号处理单元105、媒体读取器106和通信接口107。各个单元连接到管理服务器100的总线。业务服务器400和终端设备500用类似于管理服务器100的硬件来实现。

处理器101控制由管理服务器100执行的信息处理。处理器101可以是多处理器。处理器101可以是例如CPU、DSP、ASIC、FPGA等。另选地，处理器101可以是CPU、DSP、ASIC、FPGA等的两个或更多个的组合。

RAM 102是管理服务器100的主存储装置。RAM 102临时存储由处理器101执行的操作系统(OS)的程序和应用程序的至少一部分。RAM 102还存储由处理器101进行处理所使用的各种类型的数据。

HDD 103是管理服务器100的辅助存储装置。HDD 103向内部磁盘磁性地写入数据和从内部磁盘磁性地读取数据。HDD 103存储操作系统的程序、应用程序和各种类型的数据。管理服务器100可以包括其它类型的辅助存储装置，诸如闪存、SSD等，并且可以包括多个辅助存储装置。

图像信号处理单元104根据来自处理器101的指令，向连接到管理服务器100的显示器11输出图像。显示器11的示例包括阴极射线管(CRT)显示器、液晶显示器等。

输入信号处理单元105从连接到管理服务器100的输入装置12获得输入信号,并且向处理器101输出输入信号。输入装置12的示例包括定位装置(诸如鼠标、触控面板等)、键盘等。

媒体读取器106是读取存储介质13中存储的程序和数据的装置。存储介质13的示例包括磁盘(诸如软盘(FD)、HDD等)、光盘(诸如光盘(CD)、数字通用光盘(DVD)等)、磁光盘(MO)等。存储介质13的示例可以还包括非易失性半导体存储器，诸如闪存卡。媒体读取器16例如根据来自处理器101的指令，从存储介质13读取程序和数据，并且在RAM 102或HDD 103中存储所读取的程序和数据。

通信接口107是经由网络10与其它设备通信的接口。通信接口107可以是有线通信接口，或者可以是无线通信接口。

要注意的是，如上所述，除了网络10之外，业务服务器400连接到光纤通道交换机300。因此，除了用于连接到网络10的通信接口之外，业务服务器400包括用于光纤通道的通信接口(称为主总线适配器(HBA))，以用于连接到光纤通道交换机300。

图4例示了根据第二实施方式的存储设备200的硬件的示例。存储设备200包括控制器模块210和220、和驱动器机柜230和240。

控制器模块210和220是控制对驱动器机柜230和240中存储的HDD和SSD的数据访问的存储控制装置。驱动器机柜230和240是用于存储多个HDD和SSD的壳体。例如，存储设备200包括控制器模块210和220和驱动器机柜230和240，以创建冗余配置，因此即使在这些单元中的任一个单元发生故障时，也能够继续操作。

控制器模块210包括处理器211、RAM 212、非易失性RAM(NVRAM)213、网络适配器214、通道适配器215、远程适配器216、驱动器接口217、和控制器模块接口218。各个单元连接到控制器模块210的总线。控制器模块220可以用类似于控制器模块210的硬件来实现。

处理器211控制由控制器模块210执行的信息处理。处理器211可以是多处理器。处理器211可以是例如CPU、DSP、ASIC、FPGA等。另选地，处理器211可以是CPU、DSP、ASIC、FPGA等中的两个或更多个的组合。

RAM 212是控制器模块210的主存储装置。RAM 212临时存储要由处理器211执行的操作系统(固件)的程序的至少一部分。RAM 212还存储由处理器211进行的处理所使用的各种类型的数据。

NVRAM 213是控制器模块210的辅助存储装置。NVRAM 213是例如非易失性半导体存储器。NVRAM 213存储操作系统(包括固件)的程序和各种类型的数据。

网络适配器214是用于经由网络10与管理服务器100通信的通信接口。例如，用于以太网(注册商标)的接口可以用作网络适配器214。

通道适配器215是用于经由光纤通道交换机300与业务服务器400通信的光纤通道通信接口。通道适配器215用光纤通道线缆连接到光纤通道交换机300。然而，除了光纤通道之外的通信接口(例如，因特网小型计算机系统接口(iSCSI))可以用于在存储设备200与业务服务器400之间连接。

远程适配器216是用于高速、高可靠性远程数据拷贝功能(称为远程高级拷贝)的通信接口。远程适配器216用光纤通道线缆连接到光纤通道交换机300。例如，存储设备200使用远程适配器216向连接到光纤通道交换机300或其它光纤通道交换机的另一个存储设备(图2中未例示)传输存储设备200中的数据的副本。

驱动器接口217是用于与驱动器机柜230和240通信的接口。例如，诸如串行连接SCSI(SAS)等的接口可以用作驱动器接口217。

控制器模块接口218是用于连接到控制器模块220的接口。控制器模块210能够使用控制器模块接口218与控制器模块220合作地执行数据访问。例如，控制器模块210可以是有源系统，并且控制器模块220可以是待机系统。另选地，控制器模块210和220可以是以分布式方式执行数据访问的有源系统。在任一情况下，如果一方失败，则另一方可以接管数据访问，从而防止中断用户的业务。

驱动器机柜230包括SSD 231和232和HDD 233、234、235和236。与驱动器机柜230相同，驱动器机柜240包括多个SSD和多个HDD。

图5例示了根据第二实施方式的光纤通道交换机300的硬件的示例。光纤通道交换机300包括处理器301、RAM 302、闪存303、路径控制单元304、端口304a、304b、304c、304d等、和管理通信接口305。

处理器301控制由光纤通道交换机300执行的信息处理。处理器301可以是多处理器。处理器301可以是例如CPU、DSP、ASIC、FPGA等。另选地，处理器301可以是CPU、DSP、ASIC、FPGA等中的两个或更多个的组合。

RAM 302是光纤通道交换机300的主存储装置。RAM 302临时存储由处理器301执行的固件程序和应用程序的至少一部分。RAM 302还存储由处理器301进行的处理所使用的各种类型的数据。

闪存303是光纤通道交换机300的辅助存储装置。闪存303存储固件程序、应用程序和各种类型的数据。

路径控制单元304根据来自处理器301的指令，在输入侧端口与输出侧端口之间建立通信路径。路径控制单元304由例如纵横交换机构来实现。

端口304a、304b、304c、304d等是光纤通道线缆的端部处的连接器插入到的接口。

控制器模块210的通道适配器215包括端口215a。控制器模块220的通道适配器225包括端口225a。业务服务器400包括主总线适配器401和402。在业务服务器400中，到光纤通道交换机300的连接的冗余由两个主总线适配器401和402提供。因此，即使主总线适配器401和402中的一个发生故障，业务服务器400也能够经由光纤通道交换机300与存储设备200通信。光纤通道交换机300以下面描述的方式用多个光纤通道线缆连接到存储设备200和业务服务器400。

端口304a连接到主总线适配器401。端口304b连接到主总线适配器402。端口304c连接到端口215a。端口304d连接到端口225a。虽然图5中未例示，但控制器模块210和220中的每一个的远程适配器(例如，远程适配器216)连接到光纤通道交换机300的端口中的一个。

管理通信接口305是经由网络10与管理服务器100通信的通信接口。例如，以太网接口可以用作管理通信接口305。

图6是例示了根据第二实施方式的功能的示例。管理服务器100包括存储单元110、陷阱接收单元120、确定单元130、信息获取单元140和管理画面提供单元150。存储单元110用RAM 102和HDD 103中保留的存储区域来实现。陷阱接收单元120、确定单元130、信息获取单元140和管理画面提供单元150通过由处理器101执行RAM 102中的程序来实现。

存储单元110存储用于集中管理关于存储设备200、光纤通道交换机300和业务服务器400中包括的组件的信息的管理信息(储存库)。组件的类型根据设备而变化。

各个组件可以是包括多个硬件元件的硬件，诸如控制器模块210、驱动器机柜230(或驱动器机柜230中的HDD和SSD)和光纤通道交换机300。各个组件可以是硬件元件，诸如处理器211、通道适配器215、远程适配器216、驱动器接口217、控制器模块接口218、SSD231、HDD 233、端口304a和304b、主总线适配器401和402等。进一步地，各个组件可以是例如控制硬件的操作的驱动器软件、应用软件等(或可以是实现软件中的预定功能的程序模块)。

存储单元110还存储指示存储设备200、光纤通道交换机300和业务服务器400之间的连接关系的信息。存储单元110还存储关于从存储设备200接收的简单网络管理协议(Simple Network Management Protocol：SNMP)陷阱的陷阱类型的信息。

陷阱接收单元120从存储设备200接收SNMP陷阱。在接收到SNMP陷阱时，陷阱接收单元120通知确定单元130SNMP陷阱的内容。

在获得SNMP陷阱的内容时，确定单元130基于SNMP陷阱，来确定是否已经发生了需要更新关于储存库中的组件的信息的事件。如果已经发生了需要更新关于储存库中的组件的信息的事件，则确定单元130指示信息获取单元140获取对应于事件的组件的组件信息。如果事件是不需要更新关于储存库中的组件的信息的事件，则确定单元130什么都不做。

例如，如果已经发生了诸如与存储设备200、光纤通道交换机300和业务服务器400之间的连接有关的错误的事件，则确定单元130确定从存储设备200、光纤通道交换机300和业务服务器400获取关于组件的信息。进一步地，例如，如果发生了仅影响存储设备200的事件，则确定单元130确定从存储设备200获取关于组件的信息。

信息获取单元140根据来自确定单元130的指令，从存储设备200、光纤通道交换机300和业务服务器400获取指示组件的状态的组件信息。如上所述，信息获取单元140根据从SNMP陷阱确定的事件，可以从存储设备200、光纤通道交换机300和业务服务器400获取组件信息。进一步地，信息获取单元140可以从存储设备200、光纤通道交换机300和业务服务器400中的一个或两个(例如，从存储设备200)获取组件信息。组件信息由信息获取单元140获取的组件可以是访问目的地设备(例如，存储设备200)的所有组件，或者可以是根据已经发生的事件选择的访问目的地设备的一个或一些组件。

管理画面提供单元150基于存储单元110中存储的储存库，生成用于包括关于各个设备的组件的信息的管理画面的显示信息，并且向终端设备500提供显示信息。管理画面提供单元150是对应于网络服务器的功能。

存储设备200包括陷阱发送单元250和设备信息提供单元260。陷阱发送单元250和设备信息提供单元260由处理器211来实现。陷阱发送单元250和设备信息提供单元260可以通过由处理器211执行RAM 212中的预定程序来实现。

陷阱发送单元250生成对应于存储设备200中已经发生的事件的SNMP陷阱，并且向管理服务器100发送SNMP陷阱。

设备信息提供单元260响应于来自信息获取单元140的请求，向信息获取单元140返回关于存储设备200的组件的组件信息。

光纤通道交换机300包括设备信息提供单元310。设备信息提供单元310由处理器301实现。设备信息提供单元310可以通过由处理器301执行RAM 302中的预定程序来实现。

设备信息提供单元310响应于来自信息获取单元140的请求，向信息获取单元140返回关于光纤通道交换机300的组件的组件信息。

业务服务器400包括设备信息提供单元410。设备信息提供单元410由业务服务器400的处理器实现。设备信息提供单元410可以通过由业务服务器400的处理器执行业务服务器400的RAM中的程序来实现。

设备信息提供单元410响应于来自信息获取单元140的请求，向信息获取单元140返回关于业务服务器400的组件的组件信息。

终端设备500包括管理画面显示单元510。基于用于由管理画面提供单元150提供的管理画面的显示信息，管理画面显示单元510在连接到终端设备500的显示器上显示管理画面。管理画面显示单元510是对应于网络浏览器的功能。

图7例示了根据第二实施方式的管理表111、111a、111b等的示例。管理表111、111a、111b等存储在存储单元110中。用于组件的储存库包括管理表111、111a、111b等。管理表111用于例如管理关于作为存储设备200中的一个组件的端口215a的信息。

管理表111含有以下项目："port_no"、"storage_serial_no"、"ca_no"、"cm_no"、"port_name"、"port_type"、"port_status"和"link_status"。

例如，管理表111存储指示端口215a的端口编号的项目“port_no”和指示端口215a所属的存储设备200的序列号的项目“storage_serial_no”。

管理表111还针对端口215a存储端口215a所属的通道适配器215的通道适配器编号(ca_no)和端口215a所属的控制器模块210的控制器模块编号(cm_no)。管理表111还存储端口215a的端口名称(port_name)和端口类型(port_type)。端口类型指示光纤通道、iSCSI、SAS等中的一个。管理表111还存储与端口215a有关的状态(详细状态和链路状态)。详细状态(port_status)和链路状态(link_status)指示例如端口215a处于链路连接状态还是链路断开状态。

可能有这种情况：线缆可连接到的多个(例如，两个或四个)接口设置在单个端口215a(接口卡)中。在这种情况下，针对线缆可连接到的各个接口来管理链路状态。

关于存储设备200、光纤通道交换机300和业务服务器400的其它组件的信息还使用管理表111a、111b等来管理。管理表111a、111b等中的每一个含有对应于所管理的组件的项目名称。

图8例示了根据第二实施方式的连接表112的示例。连接表112被提前存储在存储单元110中。连接表112是指示存储设备200、光纤通道交换机300和业务服务器400之间的连接关系的信息。

连接表112含有以下项目："server_fc_hba_wwn"、"server_name"、"server_side_switch_port_no"、"server_side_switch_name"、"storage_fc_port_wwn"、"storage_port_name"、"storage_serial_no"、"storage_side_switch_port_no"和"storage_side_switch_name"。

例如，项目“server_fc_hba_wwn”指示业务服务器400的主总线适配器401和402中的每一个的全球名称(World Wide Name：WWN)。项目“server_name”指示业务服务器400的服务器名称。项目“server_side_switch_port_no”指示业务服务器400侧上的光纤通道交换机300的端口编号(端口304a和端口304b的端口编号)。项目“server_side_switch_name”指示由业务服务器400管理的光纤通道交换机300的交换机名称。项目“storage_fc_port_wwn”指示连接到光纤通道交换机300的存储设备200的光纤通道端口(端口215a和225a)的WWN。项目“storage_port_name”指示对应光纤通道端口(端口215a和225a)的光纤通道端口名称。

项目“storage_serial_no”指示存储设备200的序列号。项目“storage_side_switch_port_no”指示存储设备200侧上的光纤通道交换机300的端口编号(端口304c和端口304d的端口编号)。项目“storage_side_switch_name”指示由存储设备200管理的光纤通道交换机300的交换机名称。

在上述示例中，连接表112管理存储设备200、光纤通道交换机300和业务服务器400之间的连接关系。针对存储设备、光纤通道交换机和业务服务器的各个组合提前提供连接表。如果有多个组合，则多个连接表被提前提供并存储在存储单元110中。

例如，管理服务器100通过向存储设备200、光纤通道交换机300和业务服务器400询问关于通信接口的信息，可以生成连接表(包括连接表112)。

图9例示了根据第二实施方式的连接状态113的示例。连接状态113存储在存储单元110中。连接状态113是指示存储设备200、光纤通道交换机300和业务服务器400之间的连接关系的连接状态的信息。连接状态113由信息获取单元140更新。

连接状态113含有以下项目："server_id"、"sever_fc_hba_wwn"、"storage_fc_port_wwn"、"access_path_status"和"ap_status_reason"。

项目“server_id”指示业务服务器400的服务器ID。项目“server_fc_hba_wwn”指示主总线适配器401和402的WWN。项目“storage_fc_port_wwn”指示存储设备200的光纤通道端口(端口215a和225a)的WWN。项目“access_path_status”指示表示存储设备200、光纤通道交换机300和业务服务器400之间的通信是处于正常状态还是错误状态的访问路径状态。例如，如果用于存储设备200、光纤通道交换机300和业务服务器400之间的通信的所有光纤通道端口处于链路连接状态并且正常操作，则信息获取单元140确定访问路径状态是正常状态。另一方面，例如，如果用于存储设备200、光纤通道交换机300和业务服务器400之间的通信的存储设备200、光纤通道交换机300和业务服务器400的任意光纤通道端口处于链路断开状态，则信息获取单元140确定访问路径状态是错误状态。如果访问路径状态是错误状态，则项目“ap_status_reason”指示错误的原因。例如，信息获取单元140可以登记指示存储设备200、光纤通道交换机300和业务服务器400中的哪一个具有处于链路断开状态的光纤通道端口的信息，作为错误原因。

图10例示了根据第二实施方式的陷阱类型列表114。陷阱类型列表114提前存储在存储单元110中。陷阱类型列表114是指示SNMP陷阱中的特定陷阱类型的识别信息与由识别信息指示的事件的内容之间的对应关系的信息。特定陷阱类型是供应商特定陷阱类型。特定陷阱类型包括在SNMP陷阱中。陷阱类型列表114含有“Specific Trap Type”字段和“Content”字段。

“Specific Trap Type”字段存储表示特定陷阱类型的编号。“Content”字段存储由对应的特定陷阱类型指示的事件的内容。

例如，陷阱类型列表114与内容“组件的故障或劣化的通知”关联地存储特定陷阱类型“2”。即，由SNMP陷阱通知的特定陷阱类型＝2指示存储设备200的组件已经发生故障或劣化。

类似地，陷阱类型列表114存储指示特定陷阱类型"3"、"5"、“6”和"7"是已经发生在存储设备200中的错误的通知的信息，诸如“电池没电”、“需要预防性维护的事件”、“温度错误”等。

这里，“需要预防性维护的事件”是需要执行预防性维护以维护系统的正常操作的事件。“需要预防性维护的事件”的示例是这样的事件：在包括具有有限写入次数的存储元件的存储装置(诸如SSD)中，写到存储元件的次数已经达到阈值。即，通过鼓励维护，诸如提前更换这种SSD，可以维护正常操作，同时防止诸如因写到存储元件的次数超过上限而引起的数据丢失的故障。

陷阱类型列表114还与内容“RAID组的删除完成”关联地存储特定陷阱类型“9”。这指示特定陷阱类型＝9是由存储设备200的自动存储分层(automated storage tiering)完成RAID组删除处理的通知。

自动存储分层是这样的功能：在存在不同类型的驱动器的环境中，检测数据访问频率，并将数据重置于第一类型的驱动器与第二类型的驱动器之间。驱动器的类型可以包括例如以下三种类型：SSD、网盘(例如,SAS HDD)和近线盘(例如，串行ATA(SATA)HDD)。例如，在操作开始时，数据被存储在网盘中。然后，不常使用的数据被移动到较大容量、廉价的近线盘，以降低存储数据的成本。同时，经常访问的数据被移动到较高性能SSD，以缩短响应时间并提高性能。

在自动存储分层时，提供存储区域的RAID组经常被删除。在这种情况下，在使存储在该存储区域中的数据移动到除了被删除的RAID组之外的存储区域之后，删除RAID组。存储设备200使用供应商特定陷阱类型，通知管理服务器100这种RAID组删除处理的进展和完成。

陷阱类型列表114还与内容“通道适配器端口的链路状态的通知”关联地存储特定陷阱类型“10”。这指示特定陷阱类型＝10是存储设备200中包括的通道适配器215的端口215a和通道适配器225的端口225a的链路状态的通知。端口215a和225a中的每一个的链路状态可以包括链路连接和链路断开。

陷阱类型列表114还与内容“自动存储分层时的错误的通知”关联地存储特定陷阱类型“14”。这指示特定陷阱类型＝14是存储设备200的自动存储分层时的错误(例如，RAID组删除处理的中断)的通知。

陷阱类型列表114还与内容“对于TRAP#2的告警取消的通知”关联地存储特定陷阱类型“22”。这指示特定陷阱类型＝22是对于特定陷阱类型＝2的错误的告警的取消的通知。

陷阱类型列表114还与内容“对于TRAP#5的告警取消的通知”关联地存储特定陷阱类型“25”。这指示特定陷阱类型＝25是对于特定陷阱类型＝5的错误的告警的取消的通知。

陷阱类型列表114还与内容“对于TRAP#6的告警取消的通知”关联地存储特定陷阱类型“26”。这指示特定陷阱类型＝26是对于特定陷阱类型＝6的错误的告警的取消的通知。

接着，将给出由管理服务器100和存储设备200执行的过程的描述。

图11是例示了根据第二实施方式的管理服务器100所执行的处理的示例的流程图。在下文中，将逐步描述图11中例示的处理。

(S11)陷阱接收单元120从存储设备200接收SNMP陷阱。SNMP陷阱是存储设备200的状态变化的通知的示例。

(S12)确定单元130基于SNMP陷阱中包括的陷阱类型来确定错误类型。更具体地，确定单元130获得所接收的SNMP中包括的特定陷阱类型，并且对照存储单元110中存储的陷阱类型列表114检验所获得的特定陷阱类型。如上所述，陷阱类型列表114存储对应于设备错误的特定陷阱类型(2、3、5、6、7、10和14)和对应于错误取消(error cancellation)的特定陷阱类型(22、25和26)。

(S13)确定单元130确定特定陷阱类型是否指示设备错误或错误取消。如果特定陷阱类型指示设备错误或错误取消，则确定单元130指示信息获取单元140收集存储设备200的设备信息。然后，处理进行到步骤S14。如果特定陷阱类型不指示设备错误或错误取消，则处理结束。存储设备200的设备信息是包括由管理服务器100管理的存储设备200的所有组件的组件信息的信息。

(S14)信息获取单元140向存储设备200发送对存储设备200的设备信息的获取请求。

(S15)信息获取单元140从存储设备200接收设备信息。

(S16)信息获取单元140用与之前信息的差异来更新存储单元110中存储的管理表111、111a、111b等。更具体地，信息获取单元140在管理表111、111a、111b等中反映从存储设备200收集的当前设备信息与管理表111、111a、111b等中存储的信息之间的差异。

(S17)确定单元130确定步骤S13中确定的特定陷阱类型是否是与连接有关的陷阱类型。与连接有关的陷阱类型是特定陷阱类型＝10。如果特定陷阱类型是与连接有关的陷阱类型，则确定单元130指示信息获取单元140收集与存储设备200有关的设备的设备信息。然后，处理进行到步骤S18。如果特定陷阱类型不是与连接有关的陷阱类型，则处理结束。

(S18)信息获取单元140参照存储单元110中存储的连接表112，来指定与存储设备200有关的光纤通道交换机300和业务服务器400。信息获取单元140发送用于向光纤通道交换机300和业务服务器400发送设备信息的请求。光纤通道交换机300的设备信息是包括由管理服务器100管理的光纤通道交换机300的所有组件的组件信息的信息。业务服务器400的设备信息是包括由管理服务器100管理的业务服务器400的所有组件的组件信息的信息。

(S19)信息获取单元140从光纤通道交换机300接收设备信息。信息获取单元140从业务服务器400接收设备信息。

(S20)信息获取单元140用与之前设备信息的差异来更新管理表111、111a、111b等。更具体地，信息获取单元140在管理表111、111a、111b等中反映从光纤通道交换机300收集的当前设备信息与管理表111、111a、111b等中存储的信息之间的差异。类似地，信息获取单元140在管理表111、111a、111b等中反映从业务服务器400收集的当前设备信息与管理表111、111a、111b等中存储的信息之间的差异。进一步地，信息获取单元140还基于所收集的设备信息，更新存储单元110中存储的访问路径状态和连接状态113中的错误原因。

图12是例示了根据第二实施方式的由储存器执行的处理的示例的流程图。在下文中，将逐步描述图12中例示的处理。

(S21)陷阱发送单元250检测存储设备200中的设备错误或错误取消。

(S22)陷阱发送单元250生成对应于检测到的设备错误或错误取消的SNMP陷阱，并且向管理服务器100发送所生成的SNMP陷阱。

(S23)设备信息提供单元260从管理服务器100接收对设备信息的获取请求。

(S24)设备信息提供单元260响应于获取请求来收集设备信息。更具体地，设备信息提供单元260收集在存储设备200的多个组件之中的由管理服务器100管理的所有组件的组件信息。设备信息提供单元260可以通过例如在组件信息中查询那些组件来获取那些组件的组件信息。另选地，设备信息提供单元260可以将设备信息提前(例如，以预定间隔)收集到例如存储设备200的预定存储装置中。在这种情况下，设备信息提供单元260可以响应于来自管理服务器100的获取请求，从存储装置读取设备信息。

(S25)设备信息提供单元260向管理服务器100返回步骤S24中收集的设备信息。

与设备信息提供单元260一样，光纤通道交换机300的设备信息提供单元310还响应于来自管理服务器100对设备信息的获取请求，向管理服务器100返回光纤通道交换机300的设备信息。与设备信息提供单元260一样，业务服务器400的设备信息提供单元410还响应于来自管理服务器100对设备信息的获取请求，向管理服务器100返回业务服务器400的设备信息。

在图11的步骤S13的示例中，当存在设备错误或错误取消时，确定单元130向存储设备200发送对设备信息的获取请求。然而，确定单元130在接收到通过自动存储分层的预定处理的完成通知时，可以发送对设备信息的获取请求。例如，当SNMP陷阱中的特定陷阱类型是“9”时，确定单元130可以发送对设备信息的获取请求，并且获取存储设备200的设备信息。由此，可以在完成通过自动存储分层的涉及数据迁移的RAID组删除处理之后或在其它时间，适当识别各种驱动器(HDD、SSD等)的状态。

在接收到指示存储设备200的状态变化的SNMP陷阱时，管理服务器100根据SNMP陷阱的内容，确定是否查询与存储设备200有关的组件的组件信息。如果SNMP陷阱指示设备错误、错误取消或自动存储分层的预定处理(不同类型的驱动器之间的数据迁移、RAID组的删除等)的完成，则管理服务器100确定查询组件信息。如果SNMP陷阱不指示设备错误、错误取消等，则管理服务器100确定不查询组件信息。

如果确定查询组件信息，则管理服务器100根据SNMP陷阱的内容来选择一个或更多个查询目标组件。例如，如上所述，如果由SNMP陷阱指示的设备错误或错误取消只影响存储设备200，则管理服务器100将存储设备200的组件选择为查询目标。如果设备错误或错误取消不仅影响存储设备200还影响光纤通道交换机300和业务服务器400，则管理服务器100选择存储设备200、光纤通道交换机300和业务服务器400的组件，作为查询目标。管理服务器100从包括那些组件的设备(存储设备200、光纤通道交换机300和业务服务器400)获取所选查询目标组件的组件信息，并且更新管理表111、111a、111b等。

以上述方式，响应于存储设备200的状态变化，管理服务器100自主访问组件，检验与存储设备200有关的组件的组件信息，并且更新管理表111a、111b、111c等。进一步地，在SNMP陷阱通知与通信有关的状态变化的情况下，管理服务器100还基于从各个设备收集的设备信息，更新连接状态113的访问路径状态。由此，可以提高管理表111a、111b、111c等中登记的信息和连接状态113的精度。

在以上描述中，管理服务器100获取针对感兴趣的设备管理的所有组件的组件信息，作为设备信息。然而，管理服务器100可以获取与SNMP陷阱的内容对应的一个或一些组件的组件信息。例如，信息获取单元140可以根据由SNMP陷阱通知的特定陷阱类型，减少查询目标组件。例如，考虑特定陷阱类型＝10的事件。在这种情况下，基于存储单元110中存储的连接表112，信息获取单元140可以减少查询目标组件为通道适配器215和225、端口304a、304b等、以及主总线适配器401和402。在SNMP陷阱如上所述是自动存储分层的处理的进展的通知的情况下，信息获取单元140可以减少查询目标组件为HDD和SSD。以该方式，通过收集仅与感兴趣状态变化非常有关的组件的组件信息，可以降低收集无关组件的组件信息的可能性。进一步地，可以减少由管理服务器100收集的信息量，并且减小网络10上用于操作管理的通信负荷。

管理画面提供单元150基于使用图11的过程更新的管理表111、111a、111b等和连接状态113，向终端设备500提供管理画面。管理画面提供单元150将由管理画面显示单元510请求的组件的状态添加到管理画面的信息。

例如，用户通过操作连接到终端设备500的输入装置，可以为管理画面显示单元510指定要检验的组件。管理画面显示单元510根据来自用户的指令，向管理画面提供单元150请求指示指定组件的信息。管理画面显示单元510从管理画面提供单元150获得包括指定组件的状态的管理画面的信息，并且在连接到终端设备500的显示器上显示管理画面。用户可以通过参照管理画面来检验期望组件的状态。

管理服务器100提高管理表111、111a、111b等和连接状态113的精度，从而向用户提供合适的组件状态。由此，管理服务器100能够支持由用户对信息处理系统的适当操作管理。

(c)第三实施方式

下文中，将描述第三实施方式。以下主要描述与第二实施方式的区别，并且这里将不描述与其共同的特征。

在第二实施方式中，存储设备200的状态变化由SNMP陷阱通知给管理服务器100。然而，状态变化的通知可以是对轮询的响应。由此，第三实施方式例示了状态变化的通知被发送作为对轮询的响应的示例。

第三实施方式的信息处理系统包括管理服务器100a，代替管理服务器100。进一步地，第三实施方式的信息处理系统包括存储设备200a，代替存储设备200。管理服务器100a可以用与管理服务器100相同的硬件来实现。管理服务器100a的硬件元件由与管理服务器100相同的名称和附图标记来表示。存储设备200a可以用与存储设备200相同的硬件来实现。存储设备200a的硬件元件由与存储设备200相同的名称和附图标记来表示。

图13是例示了根据第三实施方式的功能的示例。管理服务器100a包括存储单元110、信息获取单元140、管理画面提供单元150和监视单元160。存储单元110、信息获取单元140和管理画面提供单元150对应于相同名称的管理服务器100的功能。监视单元160通过由处理器101执行RAM 102中的程序来实现。

除了第二实施方式中例示的信息之外，存储单元110存储由被管理的设备(在该示例中是存储设备200a)管理的预定计数器的值。由存储设备200a管理的预定计数器是在存储设备200a的配置变化(诸如组件更换等)时增加的计数器。

信息获取单元140根据来自监视单元160的指令，从存储设备200a获取设备信息。信息获取单元140可以根据来自监视单元160的指令，从光纤通道交换机300和业务服务器400获取设备信息。

监视单元160监视存储设备200a的状态。更具体地，监视单元160对存储设备200a周期性地执行轮询，以用于状态监视。在轮询时，监视单元160向存储设备200a发送用于获取由存储设备200a管理的预定计数器的值的请求。监视单元160接收对该请求的响应(计数器的值)。例如，监视单元160以数十秒至几分钟(例如，30分钟)的间隔执行轮询。

监视单元160可以使用SNMP请求和SNMP响应来执行轮询。例如，监视单元160可以向存储设备200a发送与感兴趣计数器有关的SNMP请求，并且从存储设备200a接收包括计数器的值的SNMP响应。

监视单元160将由当前轮询获得的计数器的值与之前获得的计数器的值进行比较。如果两个值不同，则监视单元160确定存储设备200a中存在状态变化，并且指示信息获取单元140获取存储设备200a的设备信息。

存储设备200a包括设备信息提供单元260、存储单元270和状态管理单元280。设备信息提供单元260对应于第二实施方式的存储设备200中的相同名称的功能。存储单元270用RAM 212或NVRAM 213中保留的存储区域来实现。状态管理单元280可以通过由处理器211执行RAM 212中的程序来实现。

存储单元270存储用于管理存储设备200a的状态的计数器的值。

状态管理单元280监视存储设备200a的状态变化，并且在检测到状态变化时，更新存储单元270中存储的计数器的值。例如，状态管理单元280响应于存储设备200a的状态变化的检测，使计数器的值加1。存储设备200a的状态变化的示例包括故障的发生、存储设备200a中的组件的更换等。

状态管理单元280响应于来自监视单元160的请求，读取存储单元270中存储的计数器的值，并且向监视单元160返回所读取的值。

光纤通道交换机300、业务服务器400和终端设备500的功能与第二实施方式的相同，并且这里将不再描述。

图14例示了根据第三实施方式的计数器管理表115的示例。计数器管理表115是用于记录从存储设备200a获得的计数器的值的信息。计数器管理表115存储在存储单元110中。计数器管理表115含有“Apparatus ID”字段和“Counter”字段。

“Apparatus ID”字段存储设备的标识符(设备ID)。“Counter”字段存储从设备获得的计数器的值。这里，存储设备200a的设备ID是“ID 1”。

例如，计数器管理表115存储包括设备ID“ID 1”和计数器“5”的记录。这指示由设备ID“ID 1”识别的存储设备200a的计数器的值(由之前轮询获得的值)是“5”。要注意的是，在管理服务器100a存储多个设备的计数器值的情况下，记录被添加到用于各个设备的计数器管理表115。

接着，将给出由管理服务器100a和存储设备200a执行的过程的描述。

图15是例示了根据第三实施方式的由管理服务器100a执行的处理的示例的流程图。在下文中，将逐步描述图15中例示的处理。

(S31)监视单元160通过轮询来监视存储设备200a的计数器。如上所述，轮询间隔是例如30秒。

(S32)监视单元160将计数器的当前值与存储单元110的计数器管理表115中存储的之前计数器值进行比较，并且确定计数器值是否变化。如果计数器值变化，则监视单元160指示信息获取单元140获取存储设备200a的设备信息。然后，处理进行到步骤S33。如果计数器值未变化，则处理返回到步骤S31，步骤S31中，监视单元160通过轮序来继续监视计数器值。要注意的是，在完成步骤S32的确定时，监视单元160在计数器管理表115中的对应于存储设备200a的“Counter”字段中存储当前计数器值(通过重写之前计数器值)。

(S33)信息获取单元140向存储设备200a发送对存储设备200a的设备信息的获取请求。

(S34)信息获取单元140从存储设备200a接收设备信息。

(S35)信息获取单元140用与之前信息的差异来更新存储单元110中存储的管理表111、111a、111b等。更具体地，信息获取单元140在管理表111、111a、111b等中反映从存储设备200a收集的当前设备信息与管理表111、111a、111b等中存储的信息之间的差异。

在由信息获取单元140执行步骤S35的操作之后，监视单元160从步骤S31重新开始图15的过程。

图16是例示了根据第三实施方式的由储存器进行的计数器更新的示例的流程图。在下文中，将逐步描述图16中例示的处理。

(S41)状态管理单元280检测因诸如组件更换等的维护工作而引起的存储设备200a的状态变化。例如，当更换存储设备200a的驱动器机柜230中容纳的任意HDD(或SSD)时，状态管理单元280检测存储设备200a的状态变化。

(S42)状态管理单元280更新存储单元270中存储的计数器的值。

在以上示例中，例示了因维护工作而引起的状态变化。然而，状态管理单元280响应于诸如存储设备200a中的错误或从错误恢复等的状态变化，可以更新存储单元270中存储的计数器的值。

图17是例示了根据第三实施方式的由储存器进行的设备信息发送的示例的流程图。在下文中，将逐步描述图17中例示的处理。

(S51)状态管理单元280从管理服务器100接收用于获取存储单元270中存储的计数器值的请求。

(S52)状态管理单元280向管理服务器100a返回计数器的值。

(S53)设备信息提供单元260确定是否从管理服务器100a接收对设备信息的获取请求。如果接收到对设备信息的获取请求，则处理进行到步骤S54。如果未接收到对设备信息的获取请求，则处理结束。

(S54)设备信息提供单元260响应于获取请求，来收集设备信息。更具体地，设备信息提供单元260收集存储设备200的多个组件之中的由管理服务器100管理的所有组件的组件信息。设备信息提供单元260可以通过例如在组件信息中查询那些组件来获取那些组件的组件信息。另选地，设备信息提供单元260可以将设备信息提前(例如，以预定间隔)收集到例如存储单元270中。在这种情况下，设备信息提供单元260可以响应于来自管理服务器100a的获取请求，从存储单元270读取设备信息。

(S55)设备信息提供单元260向管理服务器100a返回步骤S54中收集的设备信息。

以上述方式，管理服务器100a通过轮序来检验存储设备200a的状态变化。然后，在检测到存储设备200a的状态变化时，管理服务器100a自主访问组件，并且更新管理表111a、111b、111c等。由此，与第二实施方式的情况相同，可以提高管理表111a、111b、111c等中登记的信息的精度。

特别地，在更换诸如HDD等的组件的情况下，存储设备200a可以在维护模式下(用于执行维护工作并且与用于正常操作的正常模式不同的操作模式)操作。在维护模式下，通常限制正常模式下操作的SNMP陷阱通知功能和其它功能。因此，管理服务器100a通过轮序来监视存储设备200a，从而适当检测存储设备200a的状态变化。

在以上描述中，管理服务器100a获取针对感兴趣设备管理的所有组件的组件信息，作为设备信息。然而，可以使用其它方法。例如，存储设备200a可以为各个组件(或各组组件)设置一个计数器，使得针对各个组件(或各组组件)管理状态变化。在这种情况下，管理服务器100a存储多个计数器的值，并且对存储设备200a执行轮询，以获取多个计数器的值。然后，管理服务器100a从存储设备200a获取对应于值已经变化的计数器的组件的组件的组件信息。以该方式，通过收集仅与状态变化非常有关的组件的组件信息，可以降低收集无关组件的组件信息的可能性。在这种情况下，因为减少由管理服务器100a收集的信息量，所以可以减小网络10上的用于操作管理的通信负荷。

管理服务器100a可以基于之前收集设备信息时的计数器的值与当前值之间的差异，确定何时收集组件信息。例如，当计数器的值的差大于或等于预定值时，管理服务器100a可以获取设备信息。以该方式，可以基于计数器的值，来控制管理服务器100a收集设备信息的时间。

以上述方式，管理服务器100a提高管理表111、111a、111b等的精度，从而向用户提供组件的适当状态。因此，管理服务器100a能够支持由用户对信息处理系统的适当操作管理。

(d)第四实施方式

下文中，将描述第四实施方式。以下主要描述与第二实施方式和第三实施方式的区别，并且与其相同的特征这里将不描述。

在第三实施方式中，管理服务器100a通过执行轮询，获得由存储设备200a管理的计数器的值。然而，管理服务器100a可以通过执行轮询，检验除了计数器的值之外的信息。例如，在第四实施方式中，管理服务器100a通过执行轮询，管理存储设备200a的整体状态。整体状态是指示整个存储设备200a的状态的信息。

第四实施方式的信息处理系统中包括的设备和各个设备的硬件元件由与第三实施方式相同的名称和附图标记来表示。要注意的是，监视单元160通过轮询，周期性地监视存储设备200a的整体状态。进一步地，状态管理单元280周期性地更新存储设备200a的整体状态，并在存储单元270中存储整体状态。

存储设备200a的整体状态包括“正常”、“错误”和“警告”。“正常”指示存储设备200a正常操作。“错误”指示错误已经发生于存储设备200a的操作的一部分。“警告”指示这样的事件已经发生：不大影响存储设备200a的当前操作，但需要诸如由管理者等进行检查和维护的措施。

图18例示了根据第四实施方式的状态管理表116的示例。状态管理表116被存储在存储单元110中。状态管理表116含有“Apparatus ID”字段和“Overall Status”字段。

“Apparatus ID”字段存储被管理设备的ID。“Overall Status”字段存储设备的整体状态。例如，状态管理表116存储包括设备ID“ID 1”和整体状态“Normal”的记录。这指示由设备ID“ID 1”识别的存储设备200a的整体状态是“Normal”，并且存储设备200a正常操作。

要注意的是，在管理服务器100a管理多个设备的整体状态的情况下，对应于被管理设备的多个记录被存储在状态管理表116中。

图19是例示了根据第四实施方式的由管理服务器100a执行的处理的示例的流程图。在下文中，将逐步描述图19中例示的处理。

(S61)监视单元160通过轮询，周期性地监视存储设备200a的整体状态。监视单元160基于监视结果来更新存储单元110中存储的状态管理表116。要注意的是，轮询间隔是例如30秒。例如，监视单元160在状态管理表116中针对存储设备200a存储“正常”。

(S62)监视单元160在与存储设备200a通信时检测通信错误。例如，监视单元160可以通过检测到经由网络10对存储设备200a的轮询已经失败(没有来自存储设备200a的响应)，检测到通信错误。

(S63)监视单元160将“Unknown”设置为存储设备200a的整体状态。然而，监视单元160可以在存储单元110中保持步骤S63之前已经存储的整体状态。

(S64)监视单元160检测从通信错误的恢复。例如，当来自存储设备200a的对周期性轮询的响应的接收重新开始时，监视单元160可以检测到从通信错误的恢复。

(S65)监视单元160获取存储设备200a的整体状态。更具体地，监视单元160向存储设备200a发送对发送整体状态的状态请求，并且从存储设备200a接收整体状态，作为对状态请求的响应。例如，监视单元160获取整体状态“Error”。

(S66)监视单元160检测存储设备200a的整体状态的变化。例如，通过将检测到通信错误之前的整体状态(例如，“Normal”)与从通信错误恢复之后的整体状态(例如，“Error”)进行比较，监视单元160可以检测出整体状态的变化。另选地，通过将发生通信错误之后的整体状态(例如，“Unknown”)与从通信错误恢复之后的整体状态(例如，“Error”)进行比较，监视单元160可以检测出整体状态的变化。

(S67)监视单元160更新状态管理表116。更具体地，监视单元160在状态管理表116中登记步骤S65中获取的整体状态。监视单元160指示信息获取单元140获取存储设备200a的设备信息。

(S68)信息获取单元140向存储设备200发送对存储设备200a的设备信息的获取请求。

(S69)信息获取单元140从存储设备200a接收设备信息。

(S70)信息获取单元140用与之前信息的差异来更新存储单元110中存储的管理表111、111a、111b等。更具体地，信息获取单元140在管理表111、111a、111b等中反映从存储设备200a收集的当前设备信息与管理表111、111a、111b等中存储的信息之间的差异。

可能有以下情况：在步骤S66中，监视单元160未检测出整体状态的变化。在这种情况下，处理可能跳过步骤S67至S70，并且结束。即，如果检测到整体状态的变化，则监视单元160从存储设备200a获取设备信息，而如果未检测到整体状态的变化，则不从存储设备200a获取设备信息。

图20是例示了根据第四实施方式的由储存器执行的处理的示例的流程图。在下文中，将逐步描述图20中例示的处理。

(S71)状态管理单元280监视存储设备200a的状态，并周期性地更新存储单元270中存储的整体状态。更新间隔是例如30秒。

(S72)状态管理单元280在经由网络10与管理服务器100a通信时检测通信错误。例如，状态管理单元280可以检测网络适配器214的驱动器等的操作错误，作为通信错误。

(S73)状态管理单元280将存储设备200a的整体状态更新为“Error”。

(S74)状态管理单元280检测从通信错误的恢复。例如，存储设备200a重新启动与网络适配器214的驱动器等的通信错误有关的软件，从而清除错误。要注意的是，甚至在清除通信错误之后，状态管理单元280也将存储设备200a的整体状态维持为“Error”，以便向管理服务器100a报告。

(S75)状态管理单元280响应于来自管理服务器100a的状态请求，返回整体状态。例如，状态管理单元280向管理服务器100a返回整体状态“Error”。

(S76)设备信息提供单元260确定是否从管理服务器100a接收对设备信息的获取请求。如果接收到对设备信息的获取请求，则处理进行到步骤S77。如果未接收到对设备信息的获取请求，则处理结束。

(S77)设备信息提供单元260响应于获取请求收集设备信息。更具体地，设备信息提供单元260收集存储设备200a的多个组件之中的由管理服务器100a管理的所有组件的组件信息。设备信息提供单元260可以通过例如在组件信息中查询那些组件来获取那些组件的组件信息。另选地，设备信息提供单元260可以将设备信息提前(例如，以预定间隔)收集到例如存储单元270中。在这种情况下，设备信息提供单元260响应于来自管理服务器100a的获取请求，可以从存储单元270读取设备信息。

(S78)设备信息提供单元260向管理服务器100a返回步骤S77中收集的设备信息。

以上述方式，管理服务器100a通过轮序，检验存储设备200a的整体状态。然后，在检测到存储设备200a的状态变化时，管理服务器100a自主访问组件，并且更新管理表111a、111b、111c等。由此，与第三实施方式的情况相同，可以提高管理表111a、111b、111c等中登记的信息的精度。

(e)第五实施方式

下文中，将描述第五实施方式。以下主要描述与第二、第三和第四实施方式的区别，并且与其相同的特征这里将不描述。

第五实施方式例示了第二、第三和第四实施方式中描述的功能被组合以执行信息处理系统的操作管理的示例。第五实施方式的信息处理系统包括管理服务器100b，代替第二实施方式的管理服务器100。第五实施方式的信息处理系统包括存储设备200b，代替第二实施方式的存储设备200。管理服务器100b可以用与管理服务器100相同的硬件来实现。管理服务器100b的硬件元件由与管理服务器100相同的名称和附图标记来表示。存储设备200b可以用与存储设备200相同的硬件来实现。存储设备200b的硬件元件由与存储设备200相同的名称和附图标记来表示。

图21是例示了根据第五实施方式的功能的示例。管理服务器100包括存储单元110、陷阱接收单元120、确定单元130、信息获取单元140、管理画面提供单元150和监视单元160。存储单元110、陷阱接收单元120、确定单元130、信息获取单元140和管理画面提供单元150对应于相同名称的管理服务器100的功能。监视单元160对应于相同名称的管理服务器100a的功能。

存储设备200b包括陷阱发送单元250、设备信息提供单元260、存储单元270和状态管理单元280。陷阱发送单元250和设备信息提供单元260对应于相同名称的存储设备200的功能。存储单元270和状态管理单元280对应于相同名称的存储设备200a的功能。

光纤通道交换机300、业务服务器400和终端设备500的功能与第二实施方式的那些相同，并且这里将不再描述。

管理服务器100b使用SNMP陷阱和轮询，可以监视存储设备200b的状态变化。例如，在存储设备200b的状态变化经由SNMP陷阱检测到的情况下和在存储设备200b的状态变化通过轮序检测到的情况下，管理服务器100b获取各个设备的设备信息。例如，对于SNMP陷阱未由存储设备200b发布的事件，管理服务器100b通过执行轮询，能够检测到对应于该事件的存储设备200b的状态变化。进一步地，对于导致通过轮询不可检测到存储设备200b的状态变化的事件，管理服务器100b能够经由SNMP陷阱，检测对应于该事件的存储设备200b的状态变化。即通过组合使用SNMP陷阱和轮询来监视存储设备200b，，管理服务器100b更可能适当检测到存储设备200b的状态变化。由此，因为管理服务器100b能够更适当地检测状态变化，所以在更适当的时间执行响应于状态变化获取设备信息。因此，可以进一步提高由管理服务器100b进行的组件监视的精度。

要注意的是，第一实施方式中的信息处理可以通过使处理单元1b执行程序来实现。进一步地，第二至第五实施方式中的每一个实施方式中的信息处理可以通过使处理器101执行程序来实现。程序可以记录在计算机可读存储介质13中。

程序可以例如存储并分布在存储介质13中。进一步地，程序可以存储在另一个计算机中并且经由网络分布。计算机可以在其存储装置(诸如RAM 102、HDD 103等)中存储(安装)存储介质13中存储的程序或从另一个计算机接收的程序，并且可以读取和执行来自存储装置的程序。

根据一个方面，可以提高管理信息的精度。

Claims

1.一种管理设备，所述管理设备包括：

存储单元，所述存储单元被配置为存储指示多个组件的状态的管理信息，所述多个组件包括第一信息处理设备中包括的第一组件以及第二信息处理设备中包括的第二组件；以及

处理单元，所述处理单元被配置为：

在接收到指示所述第一信息处理设备的状态变化的简单网络管理协议SNMP陷阱时，响应于所述SNMP陷阱，确定是否查询指示所述多个组件的当前状态的组件信息，所述SNMP陷阱包括特定于所述第一信息处理设备的供应商的陷阱类型，

当确定查询所述组件信息时，基于所述陷阱类型检测所述状态变化影响所述第二信息处理设备，并从所述多个组件中选择所述第一组件和所述第二组件作为查询目标组件，

从所述第一信息处理设备和所述第二信息处理设备获取所选查询目标组件的组件信息，并且

基于所述组件信息来更新所述存储单元中存储的所述管理信息。

2.根据权利要求1所述的管理设备，其中，所述处理单元基于由所述SNMP陷阱指示的所述状态变化的内容，选择与所述状态变化有关的所述查询目标组件。

3.根据权利要求1所述的管理设备，其中，所述处理单元在接收到指示所述第一信息处理设备中保持的计数器的值或所述第一信息处理设备的整体状态的通知时，基于所述计数器的值或所述整体状态的变化，确定是否查询所述组件信息。

4.根据权利要求1所述的管理设备，其中：

所述第一信息处理设备是包括多种类型的存储装置的存储设备；以及

所述处理单元在从所述存储设备接收到指示完成了将数据从第一类型存储装置转移到第二类型存储装置的处理的所述SNMP陷阱时，确定查询所述组件信息。

5.一种信息处理系统，所述信息处理系统包括：

多个信息处理设备，所述多个信息处理设备均包括多个组件；以及

管理设备，所述管理设备包括：

存储单元，所述存储单元被配置为存储指示所述多个组件的状态的管理信息，所述多个组件包括所述多个信息处理设备中的第一信息处理设备中包括的第一组件以及所述多个信息处理设备中的第二信息处理设备中包括的第二组件，以及

处理单元，所述处理单元被配置为：

6.根据权利要求5所述的信息处理系统，其中，所述处理单元基于由所述SNMP陷阱指示的所述状态变化的内容，选择与所述状态变化有关的所述查询目标组件。