[go: up one dir, main page]

JP2011210064A - Log information collection system, device, method and program - Google Patents

Log information collection system, device, method and program Download PDF

Info

Publication number
JP2011210064A
JP2011210064A JP2010077999A JP2010077999A JP2011210064A JP 2011210064 A JP2011210064 A JP 2011210064A JP 2010077999 A JP2010077999 A JP 2010077999A JP 2010077999 A JP2010077999 A JP 2010077999A JP 2011210064 A JP2011210064 A JP 2011210064A
Authority
JP
Japan
Prior art keywords
log information
bmc
storage unit
monitoring
log
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010077999A
Other languages
Japanese (ja)
Inventor
Yoshinobu Ayabe
圭展 綾部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010077999A priority Critical patent/JP2011210064A/en
Publication of JP2011210064A publication Critical patent/JP2011210064A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a log information collection system which can remotely collect log information in consideration of not only hardware but also software.SOLUTION: The log information collection system includes: a server device 100 which carries a BMC; and a monitoring device 200 which monitors the server device 100, wherein the server device 100 includes a log information storage means 101 which stores log information to be output by an OS which operates in the server 100 in a storage part of the BMC, and the monitoring device 200 includes a log information obtaining means 201 for obtaining the log information stored in the storage part of the BMC by the log information storage means 101.

Description

本発明は、監視対象の装置のログ情報を収集するログ情報収集システム、ログ情報収集装置、ログ情報収集方法及びログ情報収集プログラムに関する。   The present invention relates to a log information collection system, a log information collection device, a log information collection method, and a log information collection program that collect log information of a device to be monitored.

一般的に、サーバ装置等のハードウェア(H/W)やOSの状態を監視するために、監視対象の装置のOS上で動作する監視エージェントに監視処理を実行させ、障害発生時に監視用の装置で動作する監視マネージャに通報する方式が用いられている。   Generally, in order to monitor the state of hardware (H / W) such as a server device and the OS, a monitoring agent operating on the OS of the device to be monitored is executed to perform monitoring processing when a failure occurs. A method of notifying a monitoring manager operating on the device is used.

このような方式を用いた場合、監視対象のサーバ装置のOSが稼働している状態であれば、監視マネージャから監視エージェントにアクセスし、障害情報を取得することが可能なため、保守員は取得した障害情報を障害原因の特定に役立てることができる。   When such a method is used, if the OS of the server device to be monitored is in operation, maintenance personnel can obtain the failure information by accessing the monitoring agent from the monitoring manager. The fault information can be used to identify the cause of the fault.

しかし、監視エージェントが監視マネージャに通報する前に監視対象のサーバ装置のOSが停止してしまうような障害が発生してしまった場合、監視マネージャから監視エージェントにアクセスすることができない。そのため、保守員は障害情報を入手することができず、障害原因を特定することができない。   However, if a failure that causes the OS of the monitoring target server device to stop before the monitoring agent notifies the monitoring manager, the monitoring manager cannot access the monitoring agent. Therefore, the maintenance staff cannot obtain the failure information and cannot identify the cause of the failure.

このような問題に対応するため、例えば、OSの起動状態に関係なくH/Wのイベント情報を取得する技術として、RMCP(Remote Management Control Protocol)に従ってIPMI(Intelligent Platform Management Interface)コマンドを利用する方法がある。IPMIコマンドを利用することにより、サーバ装置が搭載するBMC(Baseboard Management Controller)からH/Wイベント情報が記録されたSEL(SystemEventLog)情報を取得することができるため、保守員はリモートからH/Wの障害原因を知ることができる。   In order to deal with such a problem, for example, as a technique for acquiring H / W event information regardless of the OS activation state, a method of using an IPMI (Intelligent Platform Management Interface) command according to RMCP (Remote Management Control Protocol) There is. By using the IPMI command, SEL (System Event Log) information on which H / W event information is recorded can be acquired from a BMC (Baseboard Management Controller) mounted on the server device, so that the maintenance staff can remotely acquire the H / W Can know the cause of the failure.

また、関連する技術として、例えば、特許文献1には、監視対象の装置において、発生した一次事象と二次事象とを関連づけて記憶する方法が記載されている。   As a related technique, for example, Patent Document 1 describes a method of storing a primary event and a secondary event that occur in a monitored device in association with each other.

特開2006−114046号公報JP 2006-114046 A

上記のIPMIコマンドを利用することにより、監視対象のサーバ装置のOSが停止してしまった場合であっても、H/Wの障害に関する情報については、障害が発生したサーバ装置のBMCからIPMIで定義されるSEL情報を取得して参照することができる。   Even when the OS of the server device to be monitored is stopped by using the above IPMI command, the information regarding the H / W failure can be obtained from the BMC of the server device in which the failure has occurred by IPMI. SEL information to be defined can be acquired and referenced.

しかし、一般的にSEL情報に含まれる情報は、H/Wの障害に関連する情報がほとんどである。そのため、保守員はS/W(ソフトウェア)の観点(OSの情報やソフトウェア情報)での情報を取得することができない。したがって、IPMIを用いてもソフトウェアを考慮した判断を行うことができず、監視対象のサーバ装置のOSが停止している場合には、保守員はSEL情報を見ただけでは障害の原因の詳細や障害の影響を調べることが困難である場合があった。   However, in general, most of the information included in the SEL information is information related to H / W failures. For this reason, maintenance personnel cannot acquire information from the viewpoint of S / W (software) (OS information and software information). Therefore, even when using IPMI, it is not possible to make a determination in consideration of software, and when the OS of the server device to be monitored is stopped, the maintenance staff only looks at the SEL information and details the cause of the failure. Sometimes it was difficult to examine the effects of disability.

また、特許文献1に記載されたシステムにおいても、監視対象のサーバ装置のOSが停止状態であれば、リモートで情報を取得することができない。   Further, even in the system described in Patent Document 1, information cannot be acquired remotely if the OS of the server device to be monitored is in a stopped state.

そこで、本発明は、ハードウェアだけでなくソフトウェアも考慮して、リモートでログ情報を収集することができるログ情報収集システム、ログ情報収集装置、ログ情報収集方法及びログ情報収集プログラムを提供することを目的とする。   Accordingly, the present invention provides a log information collection system, a log information collection device, a log information collection method, and a log information collection program that can collect log information remotely in consideration of not only hardware but also software. With the goal.

本発明によるログ情報収集システムは、BMCを搭載するサーバ装置と、サーバ装置を監視する監視装置とを備え、サーバ装置は、該サーバ装置で動作するソフトウェアによって出力されるログ情報をBMCの記憶部に格納するログ情報格納手段を含み、監視装置は、ログ情報格納手段がBMCの記憶部に格納したログ情報を取得するログ情報取得手段を含むことを特徴とする。   A log information collection system according to the present invention includes a server device on which a BMC is mounted and a monitoring device that monitors the server device. The server device stores log information output by software operating on the server device. The monitoring apparatus includes log information acquisition means for acquiring log information stored in the storage unit of the BMC.

本発明によるログ情報収集装置は、BMCを搭載するログ情報収集装置であって、該ログ情報収集装置で動作するソフトウェアによって出力されるログ情報をBMCの記憶部に格納するログ情報格納手段と、ログ情報格納手段がBMCの記憶部に格納したログ情報を監視装置に送信する送信手段とを備えたことを特徴とする。   A log information collection device according to the present invention is a log information collection device equipped with a BMC, log information storage means for storing log information output by software operating in the log information collection device in a storage unit of the BMC, The log information storage means includes transmission means for transmitting the log information stored in the storage unit of the BMC to the monitoring device.

本発明によるログ情報収集方法は、BMCを搭載するサーバ装置で動作するソフトウェアによって出力されるログ情報をBMCの記憶部に格納し、BMCの記憶部に格納したログ情報を取得することを特徴とする。   The log information collection method according to the present invention is characterized in that log information output by software operating on a server device equipped with a BMC is stored in a storage unit of the BMC, and the log information stored in the storage unit of the BMC is acquired. To do.

本発明によるログ情報収集プログラムは、BMCを搭載するコンピュータに、ソフトウェアによって出力されるログ情報をBMCの記憶部に格納するログ情報格納処理と、BMCの記憶部に格納したログ情報を監視装置に送信する送信処理とを実行させることを特徴とする。   The log information collection program according to the present invention is a log information storage process for storing log information output by software in a storage unit of a BMC in a computer on which the BMC is mounted, and the log information stored in the storage unit of the BMC in a monitoring device. A transmission process for transmitting is executed.

本発明によれば、ハードウェアだけでなくソフトウェアも考慮して、リモートでログ情報を収集することができる。   According to the present invention, log information can be collected remotely in consideration of not only hardware but also software.

本発明によるログ収集システムの構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of the log collection system by this invention. 監視エージェントが実行する処理例を示す流れ図である。It is a flowchart which shows the process example which a monitoring agent performs. 監視マネージャが実行する処理例を示す流れ図である。It is a flowchart which shows the process example which the monitoring manager performs. ログデータ登録専用OEM IPMIコマンドのリクエストデータの一例を示す説明図である。It is explanatory drawing which shows an example of the request data of OEM IPMI command only for log data registration. OEM仕様の独自SELフォーマットの一例を示す説明図である。It is explanatory drawing which shows an example of the original SEL format of OEM specification. SEL情報が記録されているリポジトリの内部イメージの一例を示す説明図である。It is explanatory drawing which shows an example of the internal image of the repository in which SEL information is recorded. OSのログ情報を取得するための専用IPMIコマンドのリクエストデータの一例を示す説明図である。It is explanatory drawing which shows an example of the request data of the exclusive IPMI command for acquiring the log information of OS. 画面イメージの一例を示す説明図である。It is explanatory drawing which shows an example of a screen image. ログ収集システムの構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of a log collection system. ログ収集システムの最小の構成例を示すブロック図である。It is a block diagram which shows the minimum structural example of a log collection system.

以下、本発明の実施形態について図面を参照して説明する。図1は、本発明によるログ収集システムの構成の一例を示すブロック図である。図1に示すように、ログ収集システムは、監視サーバ29と、監視対象サーバ12とを含む。なお、本実施形態では、監視対象のサーバが1台存在する例について説明するが、複数存在していてもよい。   Embodiments of the present invention will be described below with reference to the drawings. FIG. 1 is a block diagram showing an example of the configuration of a log collection system according to the present invention. As shown in FIG. 1, the log collection system includes a monitoring server 29 and a monitoring target server 12. In this embodiment, an example in which one monitoring target server exists is described, but a plurality of servers may exist.

図1に示すように、監視サーバ29と監視対象サーバ12とは、NIC(Netwerk Interface Card)1、NIC23及び管理用LANを介して相互に接続されている。また、監視サーバ29と監視対象サーバ12とは、NIC8、NIC28及び業務用LANを介して相互に接続されている。監視サーバ29と監視対象サーバ12とは、互いに通信することができる。   As shown in FIG. 1, the monitoring server 29 and the monitoring target server 12 are connected to each other via a NIC (Network Interface Card) 1, a NIC 23, and a management LAN. The monitoring server 29 and the monitoring target server 12 are connected to each other via the NIC 8, the NIC 28, and the business LAN. The monitoring server 29 and the monitoring target server 12 can communicate with each other.

監視対象サーバ12は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。監視対象サーバ12は、BMC2を搭載している。BMC2は、外部から受信したIPMIコマンドに従って処理を実行可能なBMC用処理部9と、SEL情報を記憶するBMC用記憶部3とを備えている。なお、BMC2は、OS(OperationgSystem)4とは独立して動作する(一般に、専用のコントローラとして搭載されている)ため、OS4が停止状態であっても処理を実行することができる。   Specifically, the monitoring target server 12 is realized by an information processing apparatus such as a personal computer that operates according to a program. The monitoring target server 12 is equipped with BMC2. The BMC 2 includes a BMC processing unit 9 that can execute processing according to an IPMI command received from the outside, and a BMC storage unit 3 that stores SEL information. Note that the BMC 2 operates independently of the OS (Operation System) 4 (generally mounted as a dedicated controller), and therefore can execute processing even when the OS 4 is in a stopped state.

監視対象サーバ12では、OS4が動作している。また、監視対象サーバ12のOS4上では、監視エージェント5が動作している。監視対象サーバ12は、具体的には、監視エージェント12に従って処理を実行する。以下、監視エージェント12や監視エージェント12の各手段が実行する等の表現を用いるが、具体的には、監視対象サーバ12のCPUが、プログラムである監視エージェント12に従って処理を実行することである。   In the monitoring target server 12, the OS 4 is operating. In addition, the monitoring agent 5 is operating on the OS 4 of the monitoring target server 12. Specifically, the monitoring target server 12 executes processing according to the monitoring agent 12. Hereinafter, expressions such as those executed by the monitoring agent 12 and each means of the monitoring agent 12 are used. Specifically, the CPU of the monitoring target server 12 executes processing according to the monitoring agent 12 which is a program.

監視対象サーバ12は、OS用記憶部7と、OS用処理部11とを備えている。   The monitoring target server 12 includes an OS storage unit 7 and an OS processing unit 11.

OS用記憶部7は、具体的には、光ディスク装置や磁気ディスク装置等の記憶装置によって実現される。OS用記憶部7は、OSが出力するログ情報などを含むファイルを永続的に記憶する。具体的には、監視対象サーバ12が備える記憶装置の所定領域がOS用記憶部7として割り当てられている。   Specifically, the OS storage unit 7 is realized by a storage device such as an optical disk device or a magnetic disk device. The OS storage unit 7 permanently stores files including log information output by the OS. Specifically, a predetermined area of the storage device included in the monitoring target server 12 is allocated as the OS storage unit 7.

OS用処理部11は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。OS用処理部11は、OS4の動作に必要な処理を実行する。   Specifically, the OS processing unit 11 is realized by a CPU of an information processing apparatus that operates according to a program. The OS processing unit 11 executes processing necessary for the operation of the OS 4.

監視対象サーバ12は、監視エージェント用処理部10と、監視エージェント用記憶部6とを備えている。   The monitoring target server 12 includes a monitoring agent processing unit 10 and a monitoring agent storage unit 6.

監視エージェント用記憶部6は、具体的には、光ディスク装置や磁気ディスク装置等の記憶装置によって実現される。監視エージェント用記憶部6は、監視エージェント5の設定や状態を示す情報を記憶する。具体的には、監視対象サーバ12が備える記憶装置の所定領域が監視エージェント用記憶部6として割り当てられている。   Specifically, the monitoring agent storage unit 6 is realized by a storage device such as an optical disk device or a magnetic disk device. The monitoring agent storage unit 6 stores information indicating the setting and status of the monitoring agent 5. Specifically, a predetermined area of the storage device included in the monitoring target server 12 is allocated as the monitoring agent storage unit 6.

監視エージェント用処理部10は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。監視エージェント用処理部10は、監視エージェント5の動作に必要な処理を実行する。   Specifically, the monitoring agent processing unit 10 is realized by a CPU of an information processing apparatus that operates according to a program. The monitoring agent processing unit 10 executes processing necessary for the operation of the monitoring agent 5.

なお、エージェント用記憶部6とOS用記憶部とは、同一の記憶装置によって実現されていてもよい。また、エージェント用処理部11とOS用処理部11とは、同一のCPUによって実現されていてもよい。   The agent storage unit 6 and the OS storage unit may be realized by the same storage device. Further, the agent processing unit 11 and the OS processing unit 11 may be realized by the same CPU.

監視サーバ29は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。監視サーバ29では、OS20が動作している。また、監視サーバ29のOS20上では、監視マネージャ24が動作している。監視サーバ29は、具体的には、監視マネージャ24に従って処理を実行し、監視対象サーバ12を監視する処理を実行する。以下、監視マネージャ24や監視マネージャ24の各手段が実行する等の表現を用いるが、具体的には、監視サーバ29のCPUが、プログラムである監視マネージャ24に従って処理を実行することである。   Specifically, the monitoring server 29 is realized by an information processing apparatus such as a personal computer that operates according to a program. In the monitoring server 29, the OS 20 is operating. The monitoring manager 24 is operating on the OS 20 of the monitoring server 29. Specifically, the monitoring server 29 executes processing according to the monitoring manager 24 and executes processing for monitoring the monitoring target server 12. Hereinafter, expressions such as those executed by each means of the monitoring manager 24 and the monitoring manager 24 are used. Specifically, the CPU of the monitoring server 29 executes processing according to the monitoring manager 24 that is a program.

監視マネージャ24は、GUI制御手段21、処理部22、RMCP通信モジュール25、情報収集手段26及びエージェント通信モジュール27を含む。   The monitoring manager 24 includes a GUI control unit 21, a processing unit 22, an RMCP communication module 25, an information collection unit 26, and an agent communication module 27.

GUI制御手段21は、ディスプレイ装置等の表示装置に、ユーザの操作等に従って処理の実行結果等を表示させるように制御する機能を備えている。処理部22は、監視エージェント5の動作に必要な処理を実行する。   The GUI control unit 21 has a function of controlling a display device such as a display device to display a process execution result or the like according to a user operation or the like. The processing unit 22 executes processing necessary for the operation of the monitoring agent 5.

RMCP通信モジュール25は、監視マネージャ24が監視対象サーバのBMCと通信するために用いられる。情報収集手段26は、監視対象サーバからSEL情報やログ情報を収集する機能を備えている。エージェント通信モジュール27は、監視マネージャ24が監視エージェントと通信するために用いられる。   The RMCP communication module 25 is used for the monitoring manager 24 to communicate with the BMC of the monitoring target server. The information collecting unit 26 has a function of collecting SEL information and log information from the monitoring target server. The agent communication module 27 is used for the monitoring manager 24 to communicate with the monitoring agent.

次に、ログ収集システムの動作について説明する。図2は、監視エージェントが実行する処理例を示す流れ図である。図3は、監視マネージャが実行する処理例を示す流れ図である。まず、図2を用いて、監視エージェントが実行する処理について説明する。   Next, the operation of the log collection system will be described. FIG. 2 is a flowchart illustrating an example of processing executed by the monitoring agent. FIG. 3 is a flowchart showing an example of processing executed by the monitoring manager. First, processing executed by the monitoring agent will be described with reference to FIG.

監視対象サーバ12のOS4が動作している状態では、監視エージェント5は、所定期間毎にOS4が出力するログ情報をOS用記憶部7から読み出す(ステップS1−1)。   In a state where the OS 4 of the monitoring target server 12 is operating, the monitoring agent 5 reads log information output by the OS 4 from the OS storage unit 7 every predetermined period (step S1-1).

次いで、監視エージェント5は、読み出したログ情報に、障害や警告を示す文字列(例えば、「エラー」等の文字列)が含まれているか否かを確認する(ステップS1−2)。   Next, the monitoring agent 5 checks whether or not the read log information includes a character string indicating a failure or a warning (for example, a character string such as “error”) (step S1-2).

そして、文字列が含まれていない場合には、障害に関係しない情報であると判断し、監視エージェント5は、処理をステップS1−1に移行する(ステップS1−3のNo)。また、文字列が含まれている場合には、障害に関係する情報であると判断し、監視エージェント5は、処理をステップS1−4に移行する(ステップS1−3のYes)。   If the character string is not included, it is determined that the information is not related to the failure, and the monitoring agent 5 proceeds to step S1-1 (No in step S1-3). If the character string is included, it is determined that the information is related to the failure, and the monitoring agent 5 shifts the process to step S1-4 (Yes in step S1-3).

次いで、監視エージェント5は、障害に関係すると判断したログ情報を、IPMIコマンドとして実行可能な形式にするため、バイナリ形式に変換する(ステップS1−4)。   Next, the monitoring agent 5 converts the log information determined to be related to the failure into a binary format so that the log information can be executed as an IPMI command (step S1-4).

次いで、監視エージェント5は、バイナリ形式に変換したログ情報を、ログデータ登録専用のOEM IPMIコマンド(詳細については後述する)を利用して、BMC2に対して出力する(ステップS1−5)。すなわち、監視エージェント5は、バイナリ形式に変換したログ情報をBMC2のBMC用記憶部3に記憶させる。   Next, the monitoring agent 5 outputs the log information converted into the binary format to the BMC 2 using an OEM IPMI command dedicated to log data registration (details will be described later) (step S1-5). That is, the monitoring agent 5 stores the log information converted into the binary format in the BMC storage unit 3 of the BMC 2.

通常、IPMIコマンドで送信可能なSEL情報は16バイトに制限される。しかし、OSのログ情報は16バイトでは表現しきれない可能性がある。そのため、本実施形態では、標準仕様のSELフォーマットではなく、OEM仕様の独自SELフォーマットでOSのログ情報をBMCに登録するように制御する。   Normally, SEL information that can be transmitted by the IPMI command is limited to 16 bytes. However, the OS log information may not be expressed in 16 bytes. For this reason, in the present embodiment, control is performed so that OS log information is registered in the BMC in an original SEL format of the OEM specification instead of the standard SEL format.

本実施形態では、ログデータ登録専用OEM IPMIコマンドを利用して登録した場合、BMC2が内部で自動的にOEM仕様の独自SELフォーマットのデータを生成して登録する。具体的には、監視エージェント5が、ログデータ登録専用のOEM IPMIコマンドのリクエストデータをBMC2に送信すると、BMC用処理部9は、リクエストデータに基づいて、OEM仕様の独自SELフォーマットのデータを生成する。そして、BMC用処理部9は、生成したデータをBMC用記憶部3に記憶させる。   In this embodiment, when registering using a log data registration-dedicated OEM IPMI command, the BMC 2 automatically generates and registers original SEL format data of the OEM specification. Specifically, when the monitoring agent 5 sends request data of an OEM IPMI command dedicated to log data registration to the BMC 2, the BMC processing unit 9 generates original SEL format data of the OEM specification based on the request data. To do. Then, the BMC processing unit 9 stores the generated data in the BMC storage unit 3.

ログデータ登録専用OEM IPMIコマンドのリクエストデータの一例を図4に示す。図4に示すRECORD IDフィールドには、所定のレコードIDを示すデータが格納される。また、DATAフィールドには、OS4のログ情報をバイナリ形式に変換したデータが格納される。   An example of request data of the log data registration-dedicated OEM IPMI command is shown in FIG. The RECORD ID field shown in FIG. 4 stores data indicating a predetermined record ID. The DATA field stores data obtained by converting OS4 log information into a binary format.

次に、OEM仕様の独自SELフォーマットの一例を図5に示す。BMC用処理部9は、図5に示すRECORD TYPEのフィールドには、OEM形式を示す値を格納し、11〜12バイト目には、OSのログを登録しているレコードIDを示すデータを格納する。OEM形式とは、例えば、SEL情報が標準仕様であるか、OEM仕様であるかを示す。なお、これらのSEL情報については、BMC2が内部で管理するため、ユーザや監視エージェントが意識する必要はない。   Next, an example of the original SEL format of the OEM specification is shown in FIG. The BMC processing unit 9 stores a value indicating the OEM format in the RECORD TYPE field shown in FIG. 5, and stores data indicating the record ID in which the OS log is registered in the 11th to 12th bytes. To do. The OEM format indicates, for example, whether the SEL information is a standard specification or an OEM specification. In addition, since these SEL information is managed inside by BMC2, it is not necessary for a user or a monitoring agent to be conscious.

次に、SEL情報が記録されているリポジトリの内部イメージの一例を図6に示す。図6に示す各リポジトリは、具体的には、BMC用記憶部3によって実現される。BMC用記憶部3は、SELリポジトリ(図6(a))と、OSログ用リポジトリ(図6(b))とを含む。例えば、BMC用処理部9は、生成したOEM仕様の独自SELフォーマットのデータをSELリポジトリに格納する。また、例えば、BMC用処理部9は、ログデータ登録専用OEM IPMIコマンドのリクエストデータに含まれるログ情報をOSログ用リポジトリに格納する。   Next, an example of an internal image of a repository in which SEL information is recorded is shown in FIG. Each repository shown in FIG. 6 is specifically realized by the BMC storage unit 3. The BMC storage unit 3 includes a SEL repository (FIG. 6A) and an OS log repository (FIG. 6B). For example, the BMC processing unit 9 stores the generated original SEL format data of the OEM specification in the SEL repository. For example, the BMC processing unit 9 stores the log information included in the request data of the log data registration-dedicated OEM IPMI command in the OS log repository.

図6に示す通り、SELリポジトリのOEM SELデータ(すなわち、ログデータ登録専用OEM IPMIコマンドに従って記憶されたデータ)は、OSログ用リポジトリのデータを一意に特定可能なレコードIDを含む。そのため、監視マネージャ24がOSのログ情報を取得する際には、このOSログ用リポジトリのレコードIDをキーとしてログ情報を特定し、取得することが可能となる。   As shown in FIG. 6, the OEM SEL data in the SEL repository (that is, data stored in accordance with the log data registration-dedicated OEM IPMI command) includes a record ID that can uniquely identify the data in the OS log repository. Therefore, when the monitoring manager 24 acquires the OS log information, the log information can be specified and acquired using the record ID of the OS log repository as a key.

次に、図2を用いて、監視マネージャ24が実行する処理について説明する。   Next, processing executed by the monitoring manager 24 will be described with reference to FIG.

監視対象サーバの監視状態では、監視マネージャ24は、監視エージェント5又はBMC2が送信するSNMP(Simple Network Management Protocol) Trap(PET)を待ち受ける(ステップS2−1)。なお、予めBMC2には監視マネージャ24のIPアドレス情報等が設定されており、BMC2は、設定された情報に基づいて、処理を実行するものとする。   In the monitoring state of the monitoring target server, the monitoring manager 24 waits for an SNMP (Simple Network Management Protocol) Trap (PET) transmitted by the monitoring agent 5 or the BMC 2 (step S2-1). Note that the IP address information of the monitoring manager 24 and the like are set in advance in the BMC 2, and the BMC 2 executes processing based on the set information.

次いで、監視マネージャ24は、待ち受け状態においてデータを受信すると、受信したデータが、監視エージェント5又はBMC2からのTrapに該当するか否かを判定する(ステップS2−2)。そして、該当しないと判定すると、監視マネージャ24は、処理をステップS2−1に移行し、引き続きデータを待ち受ける。一方、該当すると判定すると、監視マネージャ24は、処理をステップS2−3に移行する。   Next, when receiving data in the standby state, the monitoring manager 24 determines whether the received data corresponds to a trap from the monitoring agent 5 or BMC 2 (step S2-2). If the monitoring manager 24 determines that it is not applicable, the monitoring manager 24 proceeds to step S2-1 and continues to wait for data. On the other hand, if it judges with applicable, monitoring manager 24 will shift processing to Step S2-3.

次いで、監視マネージャ24は、受信したデータを解析し(ステップS2−3)、障害に関するイベントを示すデータであるか否かを判定する(ステップS2−4)。そして、障害に関するイベントを示すデータでないと判定すると、監視マネージャ24は、処理をステップS2−1に移行し、再びデータを待ち受ける。一方、障害に関するイベントを示すデータであると判定すると、監視マネージャ24は、監視対象サーバ12で障害が発生していると判断し、処理をステップS2−5に移行する。   Next, the monitoring manager 24 analyzes the received data (step S2-3) and determines whether or not the data indicates an event related to a failure (step S2-4). If the monitoring manager 24 determines that it is not data indicating an event related to a failure, the monitoring manager 24 proceeds to step S2-1 and waits for data again. On the other hand, if it is determined that the data indicates an event related to a failure, the monitoring manager 24 determines that a failure has occurred in the monitored server 12, and the process proceeds to step S2-5.

次いで、監視マネージャ24は、RMCPに従ってIPMIコマンドを実行することで、リモートでBMC2にアクセスし、SEL情報を取得する(ステップS2−5)。例えば、情報収集手段26は、RMCP通信モジュールを用いて、IPMIコマンドのリクエストデータをBMC2に送信する。すると、BMC2のBMC2用処理部9は、受信したIPMIコマンドのリクエストデータに従って、BMC用記憶部3が記憶するSEL情報を抽出し、監視マネージャ24に送信する。   Next, the monitoring manager 24 executes the IPMI command according to RMCP, thereby accessing the BMC 2 remotely and acquiring SEL information (step S2-5). For example, the information collecting unit 26 transmits the request data of the IPMI command to the BMC 2 using the RMCP communication module. Then, the BMC 2 processing unit 9 of the BMC 2 extracts the SEL information stored in the BMC storage unit 3 according to the received request data of the IPMI command, and transmits it to the monitoring manager 24.

次いで、監視マネージャ24は、取得したSEL情報から、H/Wに関するイベント(標準仕様のSEL情報)とOSに関するイベント(OEM仕様のSEL情報)とを分離する(ステップS2−6)。例えば、監視マネージャ24は、取得したSEL情報のRECORD TYPEフィールドに基づいて、イベントの種別を分離する処理を実行する。   Next, the monitoring manager 24 separates an event related to H / W (standard specification SEL information) and an OS related event (OEM specification SEL information) from the acquired SEL information (step S2-6). For example, the monitoring manager 24 executes a process of separating event types based on the RECORD TYPE field of the acquired SEL information.

次いで、監視マネージャ24は、取得したSEL情報にOS4に関するイベント(OEM仕様のSEL情報)が含まれているか否かを判定する(ステップS2−7)。例えば、監視マネージャ24は、RECORD TYPEフィールドがOEM仕様であるデータが存在するか否かを判定する。   Next, the monitoring manager 24 determines whether or not the acquired SEL information includes an event related to OS4 (SEL information of OEM specifications) (step S2-7). For example, the monitoring manager 24 determines whether there is data in which the RECORD TYPE field is an OEM specification.

含まれていないと判定すると、OSのログ情報を抽出する必要がないため、監視マネージャ24は、処理をステップS2−10に移行する。   If it is determined that it is not included, there is no need to extract OS log information, and the monitoring manager 24 proceeds to step S2-10.

一方、ステップS2−7において含まれていると判定すると、監視マネージャ24は、OSに関するイベント(OEM仕様のSEL情報)に含まれるOSログ用リポジトリのレコードIDを取得する(ステップS2−8)。具体的には、監視マネージャ24は、OEM仕様のSEL情報のLOG IDフィールド(図5参照)から、OSログ用リポジトリのレコードIDを抽出する。   On the other hand, if it is determined in step S2-7 that it is included, the monitoring manager 24 acquires the record ID of the OS log repository included in the event related to the OS (SEL information of the OEM specification) (step S2-8). Specifically, the monitoring manager 24 extracts the record ID of the OS log repository from the LOG ID field (see FIG. 5) of the SEL information of the OEM specification.

次いで、監視マネージャ24は、OSのログ情報を取得するための専用IPMIコマンドを利用し、ステップS2−8で取得したレコードIDをキーにBMC2からOS4のログ情報を取得する(ステップS2−9)。例えば、情報収集手段26は、RMCP通信モジュールを用いて、抽出したレコードIDを含むOSのログ情報を取得するための専用IPMIコマンドのリクエストデータをBMC2に送信する。すると、BMC2のBMC2用処理部9は、受信したリクエストデータに含まれるレコードIDに基づいて、BMC用記憶部3のOSログ用リポジトリからログ情報を抽出し、監視マネージャ24に送信する。   Next, the monitoring manager 24 uses the dedicated IPMI command for acquiring the OS log information, and acquires the OS 4 log information from the BMC 2 using the record ID acquired in step S2-8 as a key (step S2-9). . For example, the information collecting unit 26 transmits request data of a dedicated IPMI command for acquiring OS log information including the extracted record ID to the BMC 2 using the RMCP communication module. Then, the BMC 2 processing unit 9 of the BMC 2 extracts log information from the OS log repository of the BMC storage unit 3 based on the record ID included in the received request data, and transmits the log information to the monitoring manager 24.

図7に、OSのログ情報を取得するための専用IPMIコマンドのリクエストデータの一例を示す。本実施形態では、情報収集手段26は、図7に示すリクエストデータのRECORD IDには、OSに関するイベント情報(OEM仕様のSEL情報)から抽出したレコードIDを格納する。   FIG. 7 shows an example of request data of a dedicated IPMI command for acquiring OS log information. In the present embodiment, the information collection unit 26 stores the record ID extracted from the event information related to the OS (the SEL information of the OEM specifications) in the RECORD ID of the request data shown in FIG.

次いで、監視マネージャ24は、ステップS2−9で取得したログ情報がバイナリ形式であるため、システム内部で処理できる形式(例えば、テキスト形式)に変換する(ステップS2−10)。   Next, since the log information acquired in step S2-9 is in a binary format, the monitoring manager 24 converts the log information into a format (for example, text format) that can be processed inside the system (step S2-10).

次いで、監視マネージャ24は、解析したイベントデータ(SEL情報)から、発生時刻が近いログデータ(SEL情報)を抽出する(ステップS2−11)。例えば、監視マネージャ24は、現在時刻を取得し、SEL情報に含まれるタイムスタンプが現在時刻と所定時間以内のデータを抽出する。   Next, the monitoring manager 24 extracts log data (SEL information) having a near occurrence time from the analyzed event data (SEL information) (step S2-11). For example, the monitoring manager 24 acquires the current time, and extracts data whose time stamp included in the SEL information is within the predetermined time with the current time.

次いで、監視マネージャ24は、GUI上に、H/Wに関するイベント(標準仕様のSEL情報)とOSに関するイベント(OEM仕様のSEL情報)とを、わかりやすい形式で表示する(ステップS2−12)。例えば、GUI制御手段は、発生時刻が近い標準仕様のSEL情報とOEM仕様のSEL情報とを対応付けて、ディスプレイ装置等の表示部に表示させるように制御する。図8に画面イメージの一例を示す。   Next, the monitoring manager 24 displays an event related to H / W (standard specification SEL information) and an event related to the OS (OEM specification SEL information) on the GUI in an easy-to-understand format (step S2-12). For example, the GUI control means performs control so that the standard specification SEL information and the OEM specification SEL information whose generation times are close are associated with each other and displayed on a display unit such as a display device. FIG. 8 shows an example of a screen image.

以上のように、本実施形態では、監視対象サーバの障害発生時に、H/Wの障害イベント情報だけでなく、OSやアプリケーションのログ情報も同時に得ることができる。そのため、保守員は、障害原因の特定を効率よく行うことができる。また、OSが出力するログ情報を所定期間毎にBMCに記憶させているため、障害により監視対象サーバのOSが稼働していない状態でもOSのログ情報を入手することができる。   As described above, according to the present embodiment, not only H / W failure event information but also OS and application log information can be obtained simultaneously when a monitoring target server failure occurs. Therefore, the maintenance staff can efficiently identify the cause of the failure. Further, since the log information output by the OS is stored in the BMC every predetermined period, the OS log information can be obtained even when the OS of the monitoring target server is not operating due to a failure.

なお、本実施形態では、監視マネージャがGUI上に障害情報やOSログ情報を表示するように制御したが、新たに通報部を設けることにより、リモートの監視センターにログ情報を送信するようにしてもよい。図9にログ収集システムのその他の構成例を示す。図9に示す例では、監視サーバ29は、図1で示す構成要素に加えて、通報部40を含む。通報部40は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現され、リモートの監視センターに取得したログ情報を送信する機能を備えている。   In this embodiment, the monitoring manager is controlled to display the failure information and the OS log information on the GUI. However, by newly providing a notification unit, the log information is transmitted to the remote monitoring center. Also good. FIG. 9 shows another configuration example of the log collection system. In the example illustrated in FIG. 9, the monitoring server 29 includes a notification unit 40 in addition to the components illustrated in FIG. 1. Specifically, the notification unit 40 is realized by a CPU of an information processing apparatus that operates according to a program, and has a function of transmitting log information acquired to a remote monitoring center.

例えば、通報部40は、図3のS2−12のステップにおいて、抽出したH/WイベントログとOSイベントログとをひとまとめにして、監視センターに送信する。このようにすることで、保守員や製品担当者は、送られてきた情報からH/Wの情報やOSの停止直前のOSのログ情報を入手可能なため、効率よく障害原因の特定や障害による影響を調査することが可能となる。   For example, the reporting unit 40 collectively transmits the extracted H / W event log and OS event log to the monitoring center in step S2-12 in FIG. In this way, maintenance personnel and product managers can obtain H / W information and OS log information immediately before the OS is stopped from the sent information. It becomes possible to investigate the effects of

以上のことから、本発明は以下のような課題を解決するための手段を備えているといえる。   From the above, it can be said that the present invention includes means for solving the following problems.

本発明によれば、監視対象サーバ上で動作する監視エージェントは、OSが出力するログ情報を定期的に読み出し、その読み出したログ情報をBMCに登録可能なフォーマットに変換し、IPMIコマンドを利用してBMCに登録する。登録するOSのログ情報はSELのデータ長より長いため、任意の長さのデータを登録するための特殊IPMIコマンドを利用して、BMCに書きこむ。障害が発生し、OSの稼働が停止するようなH/W障害イベントが発生した場合には、監視マネージャは、RMCP及びIPMIコマンドを利用し、リモートでSEL情報及びOSのログ情報を取得する。そして、監視マネージャは、取得したSEL情報及びOSのログ情報を発生日時順にソートし、H/W障害イベントとOSのログ出力との関連がわかりやすいよう画面に表示する。そのため、保守員はそれらの情報を見ることにより、監視対象サーバのOSが停止している状態でも、監視対象サーバで何が発生したか知ることが可能となる。   According to the present invention, the monitoring agent operating on the monitoring target server periodically reads the log information output by the OS, converts the read log information into a format that can be registered in the BMC, and uses the IPMI command. And register with the BMC. Since the OS log information to be registered is longer than the data length of the SEL, it is written in the BMC using a special IPMI command for registering data of an arbitrary length. When an H / W failure event that causes a failure and the OS operation stops occurs, the monitoring manager uses RMCP and IPMI commands to remotely acquire SEL information and OS log information. Then, the monitoring manager sorts the acquired SEL information and OS log information in the order of occurrence date and displays them on the screen so that the relationship between the H / W failure event and the OS log output is easily understood. Therefore, the maintenance staff can know what has occurred in the monitoring target server even when the OS of the monitoring target server is stopped by viewing the information.

また、本発明は、以下のような特徴を備えているといえる。   Moreover, it can be said that the present invention has the following features.

本発明によれば、OSのログ情報を、所定期間毎にIPMIコマンドを利用しBMC内に保存することにより、管理対象サーバが何かしらの障害により停止した場合でも、Out−of−Band通信により、BMCからリモートでOSのイベントログ情報とSEL情報を入手することが可能となる。また、保守員は、障害時、監視マネージャが一括して収集してきたログ情報を参照することにより、効率よく障害原因を特定することが可能となる。   According to the present invention, by storing the log information of the OS in the BMC using an IPMI command every predetermined period, even when the managed server is stopped due to some failure, the out-of-band communication is performed. OS event log information and SEL information can be obtained remotely from the BMC. In addition, the maintenance staff can efficiently identify the cause of the failure by referring to the log information collectively collected by the monitoring manager at the time of the failure.

次に、本発明によるログ収集システムの最小構成について説明する。図10は、ログ収集システムの最小の構成例を示すブロック図である。図10に示すように、ログ収集システムは、最小の構成要素として、BMCを搭載するサーバ装置100と、監視装置200とを含む。また、サーバ装置100は、ログ情報格納手段101を含む。監視装置200は、ログ情報取得手段201を含む。   Next, the minimum configuration of the log collection system according to the present invention will be described. FIG. 10 is a block diagram illustrating a minimum configuration example of the log collection system. As illustrated in FIG. 10, the log collection system includes a server device 100 on which a BMC is mounted and a monitoring device 200 as minimum components. The server apparatus 100 also includes log information storage means 101. The monitoring device 200 includes log information acquisition means 201.

図10に示す最小構成のログ収集システムでは、ログ情報格納手段101は、サーバ装置100で動作するOSが出力するログ情報をBMCの記憶部に格納する。そして、ログ情報取得手段201は、ログ情報格納手段1010がBMCの記憶部に格納したログ情報を取得する。   In the log collection system with the minimum configuration shown in FIG. 10, the log information storage unit 101 stores log information output by the OS operating on the server device 100 in the storage unit of the BMC. Then, the log information acquisition unit 201 acquires the log information stored in the storage unit of the BMC by the log information storage unit 1010.

従って、最小構成のログ収集システムによれば、ハードウェアだけでなくソフトウェアも考慮して、リモートでログ情報を収集することができる。   Therefore, according to the minimally configured log collection system, log information can be collected remotely in consideration of not only hardware but also software.

なお、本実施形態では、以下の(1)〜(5)に示すようなログ収集システムの特徴的構成が示されている。   In the present embodiment, the characteristic configuration of the log collection system as shown in the following (1) to (5) is shown.

(1)ログ収集システムは、BMCを搭載するサーバ装置(例えば、監視対象サーバ12)と、サーバ装置を監視する監視装置(例えば、監視サーバ29)とを備え、サーバ装置は、サーバ装置で動作するOS(例えば、OS4)が出力するログ情報をBMCの記憶部(例えば、BMC用記憶部3)に格納するログ情報格納手段(例えば、監視エージェント5及びBMC用処理部9によって実現される)を含み、監視装置は、ログ情報格納手段がBMCの記憶部に格納したログ情報を取得するログ情報取得手段(例えば、RMCP通信モジュール25及び情報収集部26によって実現される)を含むことを特徴とする。   (1) The log collection system includes a server device (for example, the monitoring target server 12) on which the BMC is mounted and a monitoring device (for example, the monitoring server 29) that monitors the server device, and the server device operates on the server device. Log information storage means (for example, realized by the monitoring agent 5 and the BMC processing unit 9) that stores the log information output by the OS (for example, OS4) in the BMC storage unit (for example, the BMC storage unit 3). The log information storage means includes log information acquisition means (for example, realized by the RMCP communication module 25 and the information collection part 26) for acquiring log information stored in the storage part of the BMC. And

(2)ログ収集システムにおいて、サーバ装置は、OSが出力するログ情報を所定期間ごとに抽出するログ情報抽出手段(例えば、監視エージェント5によって実現される)と、ログ情報抽出手段が抽出したログ情報を所定の形式(例えば、バイナリ形式)に変更する形式変換手段(例えば、監視エージェント5によって実現される)とを含み、ログ情報格納手段は、形式変換手段が所定の形式に変換したログ情報をBMCの記憶部に格納するように構成されていてもよい。   (2) In the log collection system, the server device extracts log information output by the OS every predetermined period (for example, realized by the monitoring agent 5), and logs extracted by the log information extraction unit Log information stored in the log information storage means is converted to a predetermined format by the format conversion means (for example, realized by the monitoring agent 5). May be stored in the storage unit of the BMC.

(3)ログ収集システムにおいて、サーバ装置は、ログ情報抽出手段が抽出したログ情報に基づいて、所定の形式(例えば、OEM仕様の独自SELフォーマット)のSEL情報を生成するSEL情報生成手段(例えば、BMC用処理部9によって実現される)を含み、ログ情報格納手段は、生成手段が生成したSEL情報と形式変換手段が所定の形式に変換したログ情報とを対応付けてBMCの記憶部に格納するように構成されていてもよい。   (3) In the log collection system, the server device generates SEL information in a predetermined format (for example, an original SEL format of the OEM specification) based on the log information extracted by the log information extraction unit (for example, The log information storage unit associates the SEL information generated by the generation unit with the log information converted into a predetermined format by the format conversion unit in the storage unit of the BMC. It may be configured to store.

(4)ログ収集システムにおいて、サーバ装置は、ログ情報取得手段から受信した所定のコマンド(例えば、IPMIコマンドやOSログを取得するための専用IPMIコマンド)に従って、BMCの記憶部に格納した情報を転送する転送手段(例えば、BMC用処理部9によって実現される)を含むように構成されていてもよい。   (4) In the log collection system, the server device stores the information stored in the storage unit of the BMC in accordance with a predetermined command (for example, an IPMI command or a dedicated IPMI command for acquiring an OS log) received from the log information acquisition unit. It may be configured to include transfer means for transferring (for example, realized by the BMC processing unit 9).

(5)ログ収集システムにおいて、サーバ装置は、ログ情報取得手段から受信した所定のコマンド(例えば、OSログを取得するための専用IPMIコマンドのリクエストデータに含まれるレコードID)に基づいて、BMCの記憶部に格納したログ情報を特定するログ情報特定手段(例えば、BMC用処理部9によって実現される)を含み、転送手段は、ログ情報特定手段が特定したログ情報をログ情報取得手段に転送するように構成されていてもよい。   (5) In the log collection system, the server device determines the BMC based on a predetermined command received from the log information acquisition unit (for example, the record ID included in the request data of the dedicated IPMI command for acquiring the OS log). Including log information specifying means (for example, realized by the BMC processing unit 9) for specifying the log information stored in the storage unit, and the transfer means transfers the log information specified by the log information specifying means to the log information acquisition means It may be configured to.

上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。   A part or all of the above embodiments can be described as in the following supplementary notes, but is not limited thereto.

(付記1)BMCを搭載するサーバ装置と、前記サーバ装置を監視する監視装置とを備え、前記サーバ装置は、該サーバ装置で動作するOSが出力するログ情報を前記BMCの記憶部に格納するログ情報格納手段を含み、前記監視装置は、前記ログ情報格納手段が前記BMCの記憶部に格納した前記ログ情報を取得するログ情報取得手段を含むことを特徴とするログ情報収集システム。 (Additional remark 1) It is provided with the server apparatus which mounts BMC, and the monitoring apparatus which monitors the said server apparatus, The said server apparatus stores the log information which OS which operates on this server apparatus outputs in the memory | storage part of the said BMC A log information collection system comprising log information storage means, wherein the monitoring device includes log information acquisition means for acquiring the log information stored in the storage unit of the BMC by the log information storage means.

(付記2)サーバ装置は、OSが出力するログ情報を所定期間ごとに抽出するログ情報抽出手段と、前記ログ情報抽出手段が抽出したログ情報を所定の形式に変更する形式変換手段とを含み、ログ情報格納手段は、前記形式変換手段が所定の形式に変換したログ情報をBMCの記憶部に格納する付記1記載のログ情報収集システム。 (Supplementary note 2) The server device includes log information extraction means for extracting log information output by the OS at predetermined intervals, and format conversion means for changing the log information extracted by the log information extraction means to a predetermined format. The log information collection system according to appendix 1, wherein the log information storage unit stores the log information converted into a predetermined format by the format conversion unit in a storage unit of the BMC.

(付記3)サーバ装置は、ログ情報抽出手段が抽出したログ情報に基づいて、所定の形式のSEL情報を生成するSEL情報生成手段を含み、ログ情報格納手段は、前記生成手段が生成したSEL情報と形式変換手段が所定の形式に変換したログ情報とを対応付けてBMCの記憶部に格納する付記2記載のログ情報収集システム。 (Supplementary Note 3) The server device includes SEL information generation means for generating SEL information in a predetermined format based on the log information extracted by the log information extraction means, and the log information storage means includes the SEL generated by the generation means. The log information collection system according to supplementary note 2, wherein the information and the log information converted into a predetermined format by the format conversion means are associated with each other and stored in the storage unit of the BMC.

(付記4)サーバ装置は、ログ情報取得手段から受信した所定のコマンドに従って、BMCの記憶部に格納した情報を転送する転送手段を含む付記1から付記3のうちのいずれかに記載のログ情報収集システム。 (Supplementary note 4) The server apparatus, according to a predetermined command received from the log information acquisition unit, includes log information according to any one of supplementary notes 1 to 3 including transfer means for transferring information stored in the storage unit of the BMC. Collection system.

(付記5)サーバ装置は、ログ情報取得手段から受信した所定のコマンドに基づいて、BMCの記憶部に格納したログ情報を特定するログ情報特定手段を含み、転送手段は、前記ログ情報特定手段が特定したログ情報を前記ログ情報取得手段に転送する付記4記載のログ情報収集システム。 (Supplementary Note 5) The server device includes log information specifying means for specifying log information stored in the storage unit of the BMC based on a predetermined command received from the log information acquiring means, and the transfer means includes the log information specifying means 5. The log information collection system according to appendix 4, wherein the log information specified by is transferred to the log information acquisition means.

(付記6)BMCを搭載するログ情報収集装置であって、該ログ情報収集装置で動作するOSが出力するログ情報を前記BMCの記憶部に格納するログ情報格納手段と、前記ログ情報格納手段が前記BMCの記憶部に格納した前記ログ情報を監視装置に送信する送信手段とを備えたことを特徴とするログ情報収集装置。 (Supplementary note 6) A log information collection device equipped with a BMC, log information storage means for storing log information output by an OS operating in the log information collection device in the storage unit of the BMC, and the log information storage means A log information collecting apparatus comprising: a transmission unit configured to transmit the log information stored in the storage unit of the BMC to a monitoring apparatus.

(付記7)OSが出力するログ情報を所定期間ごとに抽出するログ情報抽出手段と、前記ログ情報抽出手段が抽出したログ情報を所定の形式に変更する形式変換手段とを備え、ログ情報格納手段は、前記形式変換手段が所定の形式に変換したログ情報をBMCの記憶部に格納する付記6記載のログ情報収集装置。 (Supplementary note 7) log information extraction means for extracting log information output by the OS every predetermined period; and format conversion means for changing the log information extracted by the log information extraction means into a predetermined format, and storing log information The log information collection device according to appendix 6, wherein the means stores the log information converted by the format conversion means into a predetermined format in a storage unit of the BMC.

(付記8)BMCを搭載するサーバ装置で動作するOSが出力するログ情報を前記BMCの記憶部に格納し、前記BMCの記憶部に格納した前記ログ情報を取得することを特徴とするログ情報収集方法。 (Additional remark 8) The log information which OS stored in the server apparatus which mounts BMC outputs is stored in the storage part of the BMC, and the log information stored in the storage part of the BMC is acquired. Collection method.

(付記9)OSが出力するログ情報を所定期間ごとに抽出し、抽出したログ情報を所定の形式に変更し、所定の形式に変換したログ情報をBMCの記憶部に格納する付記8記載のログ情報収集方法。 (Supplementary note 9) The log information output by the OS is extracted every predetermined period, the extracted log information is changed to a predetermined format, and the log information converted into the predetermined format is stored in the storage unit of the BMC. Log information collection method.

(付記10)BMCを搭載するコンピュータに、OSが出力するログ情報を前記BMCの記憶部に格納するログ情報格納処理と、前記BMCの記憶部に格納した前記ログ情報を監視装置に送信する送信処理とを実行させるためのログ情報収集プログラム。 (Supplementary Note 10) Log information storage processing for storing log information output by the OS in the storage unit of the BMC, and transmission for transmitting the log information stored in the storage unit of the BMC to the monitoring device to a computer equipped with the BMC Log information collection program to execute processing.

(付記11)コンピュータに、OSが出力するログ情報を所定期間ごとに抽出するログ情報抽出処理と、抽出したログ情報を所定の形式に変更する形式変換処理とを実行させ、ログ情報格納処理で、所定の形式に変換したログ情報をBMCの記憶部に格納する処理を実行させる付記10記載のログ情報収集プログラム。 (Supplementary Note 11) A computer executes log information extraction processing for extracting log information output by the OS every predetermined period and format conversion processing for changing the extracted log information to a predetermined format. The log information collection program according to appendix 10, which executes processing for storing log information converted into a predetermined format in a storage unit of the BMC.

本発明は、サーバ装置等を監視する用途に適用可能である。   The present invention can be applied to a purpose of monitoring a server device or the like.

100 サーバ装置
101 ログ情報格納手段
200 監視装置
201 ログ情報取得手段
DESCRIPTION OF SYMBOLS 100 Server apparatus 101 Log information storage means 200 Monitoring apparatus 201 Log information acquisition means

Claims (8)

BMCを搭載するサーバ装置と、
前記サーバ装置を監視する監視装置とを備え、
前記サーバ装置は、
該サーバ装置で動作するソフトウェアによって出力されるログ情報を前記BMCの記憶部に格納するログ情報格納手段を含み、
前記監視装置は、
前記ログ情報格納手段が前記BMCの記憶部に格納した前記ログ情報を取得するログ情報取得手段を含む
ことを特徴とするログ情報収集システム。
A server device equipped with BMC;
A monitoring device for monitoring the server device,
The server device
Log information storage means for storing log information output by software operating on the server device in the storage unit of the BMC;
The monitoring device
A log information collection system, wherein the log information storage means includes log information acquisition means for acquiring the log information stored in the storage unit of the BMC.
サーバ装置は、ソフトウェアによって出力されるログ情報を所定期間ごとに抽出するログ情報抽出手段と、
前記ログ情報抽出手段が抽出したログ情報を所定の形式に変更する形式変換手段とを含み、
ログ情報格納手段は、前記形式変換手段が所定の形式に変換したログ情報をBMCの記憶部に格納する
請求項1記載のログ情報収集システム。
The server device includes log information extraction means for extracting log information output by the software every predetermined period;
Format conversion means for changing the log information extracted by the log information extraction means to a predetermined format,
The log information collection system according to claim 1, wherein the log information storage unit stores the log information converted into a predetermined format by the format conversion unit in a storage unit of the BMC.
サーバ装置は、ログ情報抽出手段が抽出したログ情報に基づいて、所定の形式のSEL情報を生成するSEL情報生成手段を含み、
ログ情報格納手段は、前記生成手段が生成したSEL情報と形式変換手段が所定の形式に変換したログ情報とを対応付けてBMCの記憶部に格納する
請求項2記載のログ情報収集システム。
The server device includes SEL information generation means for generating SEL information in a predetermined format based on the log information extracted by the log information extraction means,
The log information collection system according to claim 2, wherein the log information storage unit stores the SEL information generated by the generation unit and the log information converted by the format conversion unit into a predetermined format in association with each other in the storage unit of the BMC.
サーバ装置は、ログ情報取得手段から受信した所定のコマンドに従って、BMCの記憶部に格納した情報を転送する転送手段を含む
請求項1から請求項3のうちのいずれか1項に記載のログ情報収集システム。
4. The log information according to claim 1, wherein the server device includes a transfer unit configured to transfer information stored in the storage unit of the BMC in accordance with a predetermined command received from the log information acquisition unit. Collection system.
サーバ装置は、ログ情報取得手段から受信した所定のコマンドに基づいて、BMCの記憶部に格納したログ情報を特定するログ情報特定手段を含み、
転送手段は、前記ログ情報特定手段が特定したログ情報を前記ログ情報取得手段に転送する
請求項4記載のログ情報収集システム。
The server device includes log information specifying means for specifying log information stored in the storage unit of the BMC based on a predetermined command received from the log information acquiring means,
The log information collection system according to claim 4, wherein the transfer unit transfers the log information specified by the log information specifying unit to the log information acquisition unit.
BMCを搭載するログ情報収集装置であって、
該ログ情報収集装置で動作するソフトウェアによって出力されるログ情報を前記BMCの記憶部に格納するログ情報格納手段と、
前記ログ情報格納手段が前記BMCの記憶部に格納した前記ログ情報を監視装置に送信する送信手段とを
備えたことを特徴とするログ情報収集装置。
A log information collection device equipped with BMC,
Log information storage means for storing log information output by software operating in the log information collection device in the storage unit of the BMC;
A log information collection device, comprising: a transmission unit that transmits the log information stored in the storage unit of the BMC to a monitoring device.
BMCを搭載するサーバ装置で動作するソフトウェアによって出力されるログ情報を前記BMCの記憶部に格納し、
前記BMCの記憶部に格納した前記ログ情報を取得する
ことを特徴とするログ情報収集方法。
Storing log information output by software operating on a server device equipped with a BMC in the storage unit of the BMC;
The log information collection method, wherein the log information stored in the storage unit of the BMC is acquired.
BMCを搭載するコンピュータに、
ソフトウェアによって出力されるログ情報を前記BMCの記憶部に格納させるログ情報格納処理と、
前記BMCの記憶部に格納した前記ログ情報を監視装置に送信する送信処理とを
実行させるためのログ情報収集プログラム。
To a computer equipped with BMC,
Log information storage processing for storing log information output by software in the storage unit of the BMC;
A log information collection program for executing a transmission process of transmitting the log information stored in the storage unit of the BMC to a monitoring device.
JP2010077999A 2010-03-30 2010-03-30 Log information collection system, device, method and program Pending JP2011210064A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010077999A JP2011210064A (en) 2010-03-30 2010-03-30 Log information collection system, device, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010077999A JP2011210064A (en) 2010-03-30 2010-03-30 Log information collection system, device, method and program

Publications (1)

Publication Number Publication Date
JP2011210064A true JP2011210064A (en) 2011-10-20

Family

ID=44941038

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010077999A Pending JP2011210064A (en) 2010-03-30 2010-03-30 Log information collection system, device, method and program

Country Status (1)

Country Link
JP (1) JP2011210064A (en)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013109722A (en) * 2011-11-24 2013-06-06 Toshiba Corp Computer, computer system and failure information management method
JP2014078126A (en) * 2012-10-10 2014-05-01 Hitachi Systems Ltd Remote log collection system for equipment and remote log collection method for equipment
JP2015049552A (en) * 2013-08-30 2015-03-16 日本電気株式会社 Information processing device, log processing method, and program
JP2015095060A (en) * 2013-11-12 2015-05-18 日本電信電話株式会社 Log analysis apparatus and method
JP2016025656A (en) * 2014-07-22 2016-02-08 廣達電腦股▲ふん▼有限公司 Ip address out-of-band setting
JP2018160009A (en) * 2017-03-22 2018-10-11 Necプラットフォームズ株式会社 Failure information processing program, computer, failure notification method, and computer system
JP2018180982A (en) * 2017-04-14 2018-11-15 富士通株式会社 INFORMATION PROCESSING APPARATUS AND LOG RECORDING METHOD
CN110008048A (en) * 2019-03-28 2019-07-12 联想(北京)有限公司 Information processing method and electronic equipment
JP2020154705A (en) * 2019-03-20 2020-09-24 Necプラットフォームズ株式会社 Information processing device, failure monitoring method, and failure monitoring computer program
JP2021056695A (en) * 2019-09-30 2021-04-08 レノボ・シンガポール・プライベート・リミテッド Electronic device and method for outputting operation information
CN113849440A (en) * 2021-09-30 2021-12-28 北京金山云网络技术有限公司 Log access method and device and server
CN114598694A (en) * 2022-02-10 2022-06-07 宝德计算机系统股份有限公司 File transmission method and BMC log collection system
CN115129544A (en) * 2022-06-28 2022-09-30 苏州浪潮智能科技有限公司 Out-of-band one-key acquisition method, system, device and storage medium for RAID log

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013109722A (en) * 2011-11-24 2013-06-06 Toshiba Corp Computer, computer system and failure information management method
JP2014078126A (en) * 2012-10-10 2014-05-01 Hitachi Systems Ltd Remote log collection system for equipment and remote log collection method for equipment
JP2015049552A (en) * 2013-08-30 2015-03-16 日本電気株式会社 Information processing device, log processing method, and program
JP2015095060A (en) * 2013-11-12 2015-05-18 日本電信電話株式会社 Log analysis apparatus and method
JP2016025656A (en) * 2014-07-22 2016-02-08 廣達電腦股▲ふん▼有限公司 Ip address out-of-band setting
JP7063445B2 (en) 2017-03-22 2022-05-09 Necプラットフォームズ株式会社 Fault information processing program, computer, fault notification method, computer system
JP2018160009A (en) * 2017-03-22 2018-10-11 Necプラットフォームズ株式会社 Failure information processing program, computer, failure notification method, and computer system
JP2018180982A (en) * 2017-04-14 2018-11-15 富士通株式会社 INFORMATION PROCESSING APPARATUS AND LOG RECORDING METHOD
JP2020154705A (en) * 2019-03-20 2020-09-24 Necプラットフォームズ株式会社 Information processing device, failure monitoring method, and failure monitoring computer program
JP7001236B2 (en) 2019-03-20 2022-01-19 Necプラットフォームズ株式会社 Information processing equipment, fault monitoring method, and fault monitoring computer program
CN110008048A (en) * 2019-03-28 2019-07-12 联想(北京)有限公司 Information processing method and electronic equipment
JP2021056695A (en) * 2019-09-30 2021-04-08 レノボ・シンガポール・プライベート・リミテッド Electronic device and method for outputting operation information
CN113849440A (en) * 2021-09-30 2021-12-28 北京金山云网络技术有限公司 Log access method and device and server
CN113849440B (en) * 2021-09-30 2024-04-26 北京金山云网络技术有限公司 Log access method and device and server
CN114598694A (en) * 2022-02-10 2022-06-07 宝德计算机系统股份有限公司 File transmission method and BMC log collection system
CN115129544A (en) * 2022-06-28 2022-09-30 苏州浪潮智能科技有限公司 Out-of-band one-key acquisition method, system, device and storage medium for RAID log

Similar Documents

Publication Publication Date Title
JP2011210064A (en) Log information collection system, device, method and program
CA2835446C (en) Data analysis system
CN100549975C (en) Computer maintenance help system and analysis server
US20200133698A1 (en) Alerting, diagnosing, and transmitting computer issues to a technical resource in response to a dedicated physical button or trigger
CN111052087B (en) Control system, information processing device and recording medium
US8189458B2 (en) Monitoring system, monitoring device, monitored device, and monitoring method
JP6095140B2 (en) Remote monitoring system, remote monitoring method, and program
WO2015140842A1 (en) System-monitoring information processing device and monitoring method
JPWO2012046293A1 (en) Fault monitoring apparatus, fault monitoring method and program
CN103414916A (en) Fault diagnosis system and method
US20120136970A1 (en) Computer system and method for managing computer device
US7647530B2 (en) Network fault pattern analyzer
JP2011034181A (en) Different type of communication server system for remote monitoring or remote operation
CN109981388A (en) A kind of method and apparatus of monitoring device
US8554908B2 (en) Device, method, and storage medium for detecting multiplexed relation of applications
CN111817865A (en) Method for monitoring network management equipment and monitoring system
CN101677278A (en) Method and system for monitoring availability of network information system
JP2012128539A (en) Apparatus information management system
CN113067722A (en) Data management platform and working method thereof
CN119514877A (en) Pig breeding equipment full life cycle monitoring management system, media and terminals
CN105187268A (en) A fine-grained state information synchronous collection system for cluster computing environment
JP2015026154A (en) Device information management apparatus, device monitoring system, device information management method, device monitoring method, device information management program, and device monitoring program
KR100852192B1 (en) Network management apparatus and method thereof, and recoing medium
US20120072545A1 (en) Remote maintenance and monitoring service framework for heterogeneous device and system
JP2006099479A (en) Hospital audit log management support system and hospital audit log server