JP2018160009A - Failure information processing program, computer, failure notification method, and computer system - Google Patents
Failure information processing program, computer, failure notification method, and computer system Download PDFInfo
- Publication number
- JP2018160009A JP2018160009A JP2017055756A JP2017055756A JP2018160009A JP 2018160009 A JP2018160009 A JP 2018160009A JP 2017055756 A JP2017055756 A JP 2017055756A JP 2017055756 A JP2017055756 A JP 2017055756A JP 2018160009 A JP2018160009 A JP 2018160009A
- Authority
- JP
- Japan
- Prior art keywords
- failure information
- failure
- computer
- log
- log data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステムに関する。 The present invention relates to a failure information processing program, a computer, a failure notification method, and a computer system.
コンピュータにおいて障害が発生すると、コンピュータは処理をOS(Operating System)からBIOS(Basic Input Output System)にハンドオーバし、BIOSによりログデータの採取がなされ、当該ログデータがBMC(Baseboard Management Controller)に送信される。ハンドオーバとは、CPUの制御権を移転することである。
特許文献1には、障害発生などによりBIOSとBMCとの間の通信要求が発生した場合に、OSに処理を再開させ、当該通信要求に伴う処理を分割して定期的に送信し、実行することが開示されている。
When a failure occurs in the computer, the computer hands over the processing from the OS (Operating System) to the BIOS (Basic Input Output System), the log data is collected by the BIOS, and the log data is transmitted to the BMC (Baseboard Management Controller). The Handover refers to transferring the control right of the CPU.
In
コンピュータに障害が発生してからログデータの送信が完了するまで、OSは制御権を有しない。つまり、この間、OSの処理は停止した状態となる。これにより、コンピュータに障害が発生したときに、見かけ上の処理性能の低下が生じてしまうという。
本発明の目的は、上述した課題を解決する障害情報処理プログラム、コンピュータ、障害通知方法、コンピュータシステムを提供することにある。
The OS has no control right until the transmission of the log data is completed after the failure of the computer. That is, during this time, the OS processing is stopped. As a result, when a failure occurs in the computer, the apparent processing performance is degraded.
An object of the present invention is to provide a failure information processing program, a computer, a failure notification method, and a computer system that solve the above-described problems.
本発明の第1の態様によれば、障害情報処理プログラムは、コンピュータに、前記コンピュータのBIOSによって生成された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、前記第1の障害情報に基づいて、前記第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップと実行させる。 According to the first aspect of the present invention, the failure information processing program acquires, in the computer, first failure information related to a failure that has occurred in its own device, generated by the BIOS of the computer, and the first Based on the failure information, the data amount of the first failure information is reduced, thereby executing the reduction step of generating second failure information that is failure information to be transmitted to the management apparatus.
本発明の第2の態様によれば、コンピュータは、CPUと、前記CPUに、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、前記第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、上記態様に係る障害情報処理プログラムを記憶する第2記憶装置とを備える。 According to the second aspect of the present invention, the computer generates the CPU based on the first failure information, the generation step of generating first failure information related to the failure that has occurred in the CPU, and the CPU. A first storage device that stores a BIOS including a program for executing a transmission step of transmitting the second failure information that has been transmitted to the management device, and a second storage device that stores a failure information processing program according to the above aspect Is provided.
本発明の第3の態様によれば、障害通知方法は、コンピュータがBIOSの実行により、当該コンピュータに発生した障害に関する第1の障害情報を取得する取得ステップと、前記第1の障害情報に基づいて、前記第1障害情報のデータ量を縮小した障害情報である第2障害情報を生成する縮小ステップと、前記第2の障害情報を管理装置に送信する送信ステップとを含む。 According to the third aspect of the present invention, the failure notification method is based on the acquisition step in which the computer acquires the first failure information related to the failure that has occurred in the computer by executing the BIOS, and the first failure information. A reduction step of generating second failure information which is failure information obtained by reducing the data amount of the first failure information, and a transmission step of transmitting the second failure information to the management device.
本発明の第4の態様によれば、コンピュータシステムは、自装置に発生した障害に関する第1障害情報を解析することで第2障害情報を生成するコンピュータと、前記第2障害情報を解析する管理装置とを備える。 According to the fourth aspect of the present invention, the computer system includes a computer that generates the second failure information by analyzing the first failure information related to the failure that has occurred in the device, and the management that analyzes the second failure information. Device.
上記態様のうち少なくとも1つの態様によれば、コンピュータは、障害が発生したときに、見かけ上の処理性能の低下が生じることを防ぐことができる。 According to at least one of the above aspects, the computer can prevent an apparent decrease in processing performance when a failure occurs.
以下、図面を参照しながら実施形態について詳しく説明する。
図1は、第1の実施形態に係るコンピュータのハードウェア構成を示す概略ブロック図である。
コンピュータ1は、CPU100、メインメモリ200、不揮発メモリ300、ストレージ400、インタフェース500を備える。
CPU100は、プログラムを不揮発メモリ300またはストレージ400から読み出してメインメモリ200に展開し、当該プログラムに従って処理を実行する。
不揮発メモリ300は、BIOS01を記憶する。不揮発メモリ300の例としては、EEPROM(Electrically Erasable Programmable Read-Only Memory)、フラッシュメモリなどが挙げられる。
ストレージ400は、OS02、およびOS02上で動作するアプリケーションプログラムである障害情報処理プログラム03を記憶する。ストレージ400の例としては、HDD(Hard Disk Drive)、SSD(Solid State Drive)、磁気ディスク、光磁気ディスク、CD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disc Read Only Memory)、半導体メモリ等が挙げられる。ストレージ400は、コンピュータ1のバスに直接接続された内部メディアであってもよいし、インタフェース500または通信回線を介してコンピュータ1に接続される外部メディアであってもよい。
メインメモリ200、不揮発メモリ300およびストレージ400は、記憶装置の一例である。
Hereinafter, embodiments will be described in detail with reference to the drawings.
FIG. 1 is a schematic block diagram illustrating a hardware configuration of a computer according to the first embodiment.
The
The
The
The
The
また、CPU100は、BIOS01に従って、第1記憶領域M1および第2記憶領域M2をメインメモリ200に確保する。
第1記憶領域M1は、BIOS01によって生成されたログデータである第1ログデータと障害の検出日時と解析済フラグとを記憶する領域である。解析済フラグは、関連付けられた第1ログデータの解析が完了しているか否かを示すビットであって、解析されていない場合に0を示し、解析されている場合に1を示す。
第2記憶領域M2は、障害情報処理プログラム03によって生成されたログデータである第2ログデータと障害の検出日時と通報済フラグとを記憶する領域である。通報済フラグは、関連付けられた第2ログデータのBMCへの通報が完了しているか否かを示すビットであって、通報されていない場合に0を示し、通報されている場合に1を示す。
第1記憶領域M1および第2記憶領域M2は、いずれもBIOS01と障害情報処理プログラム03との両方によって参照される。そのため、CPU100は、メインメモリ200のうちアドレスが変動しないメモリブロック(固定メモリ)の予め定められたアドレスに、予め定められたサイズの領域を、第1記憶領域M1および第2記憶領域M2として確保する。
Further, the
The first storage area M1 is an area for storing first log data, which is log data generated by the
The second storage area M2 is an area for storing second log data, which is log data generated by the failure
Both the first storage area M1 and the second storage area M2 are referred to by both the
図2は、第1の実施形態に係るコンピュータのソフトウェア構成を示す概略ブロック図である。
CPU100は、BIOS01の実行により、ログ収集部101、第1ログ記録部102、第2ログ取得部103、送信部104として機能する。
FIG. 2 is a schematic block diagram illustrating a software configuration of the computer according to the first embodiment.
The
ログ収集部101は、障害を検出したハードウェアの障害箇所を特定できる情報を保持しているレジスタをリードし、リードした情報に基づいて第1ログデータを生成する。
The
第1ログ記録部102は、ログ収集部101が生成した第1ログデータを、解析済フラグに関連付けて第1記憶領域M1に記録する。第1ログ記録部102は、第1ログデータの記録時に、解析済フラグを0にセットする。
The first
第2ログ取得部103は、第2記憶領域M2に格納されている情報を取得する。第2記憶領域M2は固定メモリのメモリブロックに確保されているため、第2ログ取得部103は、第2記憶領域M2を参照することで、障害情報処理プログラム03が生成した第2ログデータを取得することができる。第2ログ取得部103は、0を示す解析済フラグに関連付けられた第2ログデータを取得する。
The second
送信部104は、第2ログ取得部103が取得した第2ログデータを、BMCに送信する。送信部104は、第2記憶領域M2が記憶する通報済フラグのうち、送信が完了した第2ログデータに関連付けられたものを1にセットする。
The
CPU100は、障害情報処理プログラム03の実行により、第1ログ取得部105、解析部106、縮小部107、第2ログ記録部108として機能する。
The
第1ログ取得部105は、第1記憶領域M1に格納されている情報を取得する。第1記憶領域M1は固定メモリのメモリブロックに確保されているため、第1ログ取得部105は、第1記憶領域M1を参照することで、BIOS01が生成した第1ログデータを取得することができる。第1ログ取得部105は、0を示す解析済フラグに関連付けられた第1ログデータを取得する。
The first
解析部106は、取得された第1ログデータの解析を実行する。つまり、CPU100は、BMCによる解析の前に、OS02上で一時解析を行う。解析部106は、第1記憶領域M1に記録された解析済フラグのうち、解析が完了した第1ログデータに関連付けられたものを1にセットする。
The
縮小部107は、解析部106による解析の結果に基づいて、第1ログデータよりデータ量の小さい第2ログデータを生成する。例えば、縮小部107は、第1ログデータのうち、障害との関係性の小さいイベントログを削除することで、データ量を削減する。なお、縮小部107は、解析部106による解析の終了後、第2ログデータを生成するため、解析済フラグは、第1ログデータに基づいて第2ログデータが作成されたか否かを示す情報であるともいえる。
The
第2ログ記録部108は、第2ログデータを、通報済フラグに関連付けて第2記憶領域M2に記録する。第2ログ記録部108は、第2ログデータの記録時に、通報済フラグを0にセットする。
The second
図3は、第1の実施形態に係るコンピュータによるログ収集処理を示すフローチャートである。
コンピュータ1に障害が発生し、障害を検出したハードウェアがCPU100に割り込み要求を発すると、ログ収集処理を開始する。まず、CPU100は、ハンドオーバにより、OS02からBIOS01に制御権を移転する(ステップS001)。BIOS01の実行により、CPU100のログ収集部101は、ハードウェアの障害箇所を特定可能な情報を保持するレジスタから情報をリードし、これに基づいて第1ログデータを生成する(ステップS002)。
FIG. 3 is a flowchart showing log collection processing by the computer according to the first embodiment.
When a failure occurs in the
次に、第1ログ記録部102は、第1記憶領域M1に空きがあるか否かを判定する(ステップS003)。第1記憶領域M1に空きがない場合(ステップS003:NO)、第1記憶領域M1が記憶する最も古い第1ログデータを削除する(ステップS004)。第1記憶領域M1に空きがある場合(ステップS003:YES)、または第1記憶領域M1から第1ログデータを削除した場合、第1ログ記録部102は、ステップS002で生成された第1ログデータを、第1記憶領域M1に記録する(ステップS005)。このとき、第1ログ記録部102は、第1ログデータに関連付けられた解析済フラグを0にセットする。なお、第1ログ記録部102は、第1記憶領域M1の空き領域の末尾に第1ログデータを記録する。
Next, the first
次に、第1ログ記録部102は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS006)、ログ収集処理を終了する。これにより、コンピュータ1は、ログデータをBMCに送信する前にOS02が制御権を取得する。
Next, the first
図4は、第1の実施形態に係るコンピュータによる障害通知処理を示すフローチャートである。
CPU100は、所定周期に係るタイミングに障害情報処理プログラム03を実行し、障害通知処理を開始する。まず、第1ログ取得部105は、第1記憶領域M1に格納された情報を参照し、0を示す解析済フラグがあるか否かを判定する(ステップS101)。0を示す解析済フラグが無い場合(ステップS101:NO)、コンピュータ1は、障害通知処理を終了する。
FIG. 4 is a flowchart showing failure notification processing by the computer according to the first embodiment.
The
他方、0を示す解析済フラグがある場合(ステップS101:YES)、第1ログ取得部105は、0を示す解析済フラグに関連付けられた第1ログデータを取得する(ステップS102)。次に、解析部106は、取得された第1ログデータを解析する(ステップS103)。縮小部107は、解析部106による解析結果に基づいて、第1ログデータのデータ量を削減した第2ログデータを生成する(ステップS104)。解析部106は、解析対象となった第1ログデータに関連付けられた解析済フラグの値を1にセットする(ステップS105)。
On the other hand, when there is an analyzed flag indicating 0 (step S101: YES), the first
次に、第2ログ記録部108は、第2記憶領域M2に空きがあるか否かを判定する(ステップS106)。第2記憶領域M2に空きがない場合(ステップS106:NO)、第2記憶領域M2が記憶する最も古い第2ログデータを削除する(ステップS107)。第2記憶領域M2に空きがある場合(ステップS106:YES)、または第2記憶領域M2から第2ログデータを削除した場合、第2ログ記録部108は、ステップS104で生成された第2ログデータを、第2記憶領域M2に記録する(ステップS108)。このとき、第2ログ記録部108は、第2ログデータに関連付けられた通報済フラグを0にセットする。なお、第2ログ記録部108は、第2記憶領域M2の空き領域の末尾に第2ログデータを記録する。
Next, the second
次に、CPU100は、ハンドオーバにより、OS02からBIOS01に制御権を移転する(ステップS109)。BIOS01の実行により、送信部104は、第2記憶領域M2に格納された情報を参照し、0を示す通報済フラグがあるか否かを判定する(ステップS110)。0を示す通報済フラグが無い場合(ステップS110:NO)、CPU100は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS111)、障害通知処理を終了する。
Next, the
他方、0を示す通報済フラグがある場合(ステップS110:YES)、第2ログ取得部103は、0を示す解析済フラグに関連付けられた第2ログデータを取得する(ステップS112)。次に、送信部104は、BMCに取得された第2ログデータを送信する(ステップS113)。第2ログデータは、第1ログデータよりデータ量が小さいため、第2ログデータの送信時間は第1ログデータの送信時間より短い。送信部104は、第2ログデータの送信を完了すると、当該第2ログデータに関連付けられた通報済フラグの値を1にセットする(ステップS114)。そして、CPU100は、ハンドオーバにより、BIOS01からOS02に制御権を移転し(ステップS111)、障害通知処理を終了する。
On the other hand, when there is a reported flag indicating 0 (step S110: YES), the second
このように、第1の実施形態によれば、コンピュータ1に障害が発生した場合、CPU100は、障害情報処理プログラム03の実行により、第1ログデータのデータ量を縮小して第2ログデータを生成する。発明者は、一般的なコンピュータにおける障害処理において、処理時間の多くがログデータの送信に費やされているという知見を得ている。つまり、第1の実施形態に係るコンピュータ1によれば、BMCに送信すべきログデータのデータ量を削減することで、BIOS01が制御権を占有する時間が短くなることがわかる。
As described above, according to the first embodiment, when a failure occurs in the
また、第1の実施形態によれば、コンピュータ1は、障害情報処理プログラム03の実行により、第1ログデータを解析し、これに基づいて第2ログデータを生成する。つまり、コンピュータ1は、第1ログデータの一次解析を行い、その解析結果である第2ログデータをBMCに解析させる。これにより、コンピュータ1は、ログデータの解析精度を確保しつつ、BIOS01が制御権を占有する時間を短くすることができる。
According to the first embodiment, the
以上、図面を参照して一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、様々な設計変更等をすることが可能である。
第1の実施形態に係るコンピュータ1は、OS02上で動作する障害情報処理プログラム03によって、第1ログ取得部105、解析部106、縮小部107、第2ログ記録部108として機能するが、これに限られない。例えば、他の実施形態においては、BIOS01がこれらの少なくとも一部の機能を実現するためのプログラムを含むものであってもよい。この場合、第1ログデータの生成後にOS02へのハンドオーバがなされないが、送信するデータ量が削減されるため、BIOS01によって第1ログデータを送信する場合と比較して、OS02の性能低下を防ぐことができる。また例えば、他の実施形態においては、OS02がこれらの少なくとも一部の機能を実現するためのプログラムを含むものであってもよい。
As described above, the embodiment has been described in detail with reference to the drawings. However, the specific configuration is not limited to that described above, and various design changes and the like can be made.
The
また、第1の実施形態に係るコンピュータ1は、BIOS01によって、第2ログデータがBMCに送信されるが、これに限られない。例えば、他の実施形態に係るコンピュータ1は、障害情報処理プログラム03またはOS02によって第2ログデータを送信してもよい。
Moreover, although the
また、第1の実施形態に係る障害情報処理プログラム03は、コンピュータ1に第1ログデータを解析させるが、これに限られない。例えば、他の実施形態に係る障害情報処理プログラム03は、コンピュータ1に第1ログデータの間引きなどにより、解析なしにデータ量を削減させるものであってもよい。
The fault
また、第1の実施形態において、第1記憶領域M1および第2記憶領域M2がメインメモリ200上に確保されるが、これに限られない。例えば、他の実施形態においては、第1記憶領域M1および第2記憶領域M2が不揮発メモリ300上に確保されてもよい。この場合、シャットダウン等によりコンピュータ1のサービスが停止しても、ログデータを保持し続けることができる。
In the first embodiment, the first storage area M1 and the second storage area M2 are secured on the
また、第1の実施形態に係るコンピュータ1は、BMCにログデータを送信するが、これに限られない。例えば、他の実施形態に係るコンピュータ1は、BMCにログデータ以外の障害情報(例えば、障害の解析結果)を送信してもよい。この場合、コンピュータ1は、当該障害情報(第1の障害情報)のデータ量を小さくした第2の障害情報を生成する。
Moreover, although the
《障害情報処理プログラムの基本構成》
図5は、コンピュータの基本構成を示す概略ブロック図である。
上述した実施形態では、障害情報処理プログラムを実行するコンピュータの一実施形態として図2に示す構成について説明したが、障害情報処理プログラムを実行するコンピュータの基本構成は、図5に示すとおりである。
すなわち、コンピュータ9は、CPU91と、第1記憶装置92と、第2記憶装置93とを備える。
第1記憶装置92は、CPU91に、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOS001を記憶する。
第2記憶装置93は、BIOS001によって生成された第1障害情報を取得する取得ステップと、第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップとを実行させるための障害情報処理プログラム002を記憶する。
これにより、コンピュータ9は、障害が発生したときに、見かけ上の処理性能の低下が生じることを防ぐことができる。
<< Basic configuration of fault information processing program >>
FIG. 5 is a schematic block diagram showing the basic configuration of the computer.
In the above-described embodiment, the configuration illustrated in FIG. 2 has been described as an embodiment of a computer that executes a failure information processing program. The basic configuration of a computer that executes a failure information processing program is as illustrated in FIG.
That is, the
The
The
Thus, the
《コンピュータシステムの基本構成》
図6は、コンピュータシステムの基本構成を示す概略ブロック図である。
コンピュータシステム2は、コンピュータ9と、管理装置10とを備える。
コンピュータ9は、自装置に発生した障害に関する第1障害情報を解析することで第2障害情報を生成する。管理装置10は、第2障害情報を解析する。管理装置10は、例えば、BMCである。
これにより、コンピュータシステム2は、コンピュータ9に発生した障害を、コンピュータ9と管理装置10とで分散して解析することができる。
<Basic configuration of computer system>
FIG. 6 is a schematic block diagram showing the basic configuration of the computer system.
The
The
As a result, the
《付記》
上記の実施形態の一部又は全部は、以下の付記のようにも記載されうるが、以下には限られない。
<Appendix>
A part or all of the above-described embodiment can be described as in the following supplementary notes, but is not limited thereto.
(付記1)
コンピュータに、
前記コンピュータのBIOSによって生成された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、
前記第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップと
実行させるための障害情報処理プログラム。
(Appendix 1)
On the computer,
An acquisition step of acquiring first failure information related to a failure that has occurred in the device, generated by the BIOS of the computer;
A failure information processing program for executing a reduction step of generating second failure information, which is failure information to be transmitted to the management device, by reducing the data amount of the first failure information.
(付記2)
前記コンピュータに、前記第1障害情報の解析を実行する解析ステップをさらに実行させ、
前記縮小ステップは、前記コンピュータが前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて前記第2障害情報を生成するステップである
付記1に記載の障害情報処理プログラム。
(Appendix 2)
Causing the computer to further execute an analysis step of analyzing the first failure information;
The failure information processing program according to
(付記3)
前記BIOSによって生成された前記第1障害情報は、前記コンピュータの記憶装置の所定のアドレスおよびデータサイズに係る記憶領域に記録され、
前記取得ステップは、前記コンピュータが前記記憶装置の前記記憶領域に記憶された情報を取得するステップである
付記1または付記2に記載の障害情報処理プログラム。
(Appendix 3)
The first failure information generated by the BIOS is recorded in a storage area according to a predetermined address and data size of a storage device of the computer,
The failure information processing program according to
(付記4)
前記BIOSによって生成された前記第1障害情報は、障害に係るログデータと、当該ログデータに基づいて前記第2障害情報が作成されたか否かを示す情報とを関連付けたものであり、
前記縮小ステップは、前記第1障害情報のうち前記第2障害情報作成されていないログデータに基づいて前記第2障害情報を作成するステップである
付記3に記載の障害情報処理プログラム。
(Appendix 4)
The first failure information generated by the BIOS associates log data related to a failure with information indicating whether or not the second failure information is created based on the log data,
The failure information processing program according to appendix 3, wherein the reducing step is a step of creating the second failure information based on log data for which the second failure information is not created among the first failure information.
(付記5)
CPUと、
前記CPUに、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、前記第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、
付記1から付記4の何れか1つに記載の障害情報処理プログラムを記憶する第2記憶装置と
を備えるコンピュータ。
(Appendix 5)
CPU,
A generation step of generating first failure information related to a failure that has occurred in the own device to the CPU, and a transmission step of transmitting second failure information generated based on the first failure information to the management device. A first storage device for storing a BIOS including a program for execution;
A computer comprising: a second storage device that stores the failure information processing program according to any one of
(付記6)
前記第2記憶装置は、前記障害情報処理プログラムを実行可能なOSを記憶する
付記5に記載のコンピュータ。
(Appendix 6)
The computer according to claim 5, wherein the second storage device stores an OS capable of executing the failure information processing program.
(付記7)
前記CPUは、前記障害が検出されたときに前記BIOSに制御権を移転し、前記生成ステップの実行後に前記BIOSから前記OSに制御権を移転する
付記6に記載のコンピュータ。
(Appendix 7)
The computer according to claim 6, wherein the CPU transfers control right to the BIOS when the failure is detected, and transfers control right from the BIOS to the OS after execution of the generation step.
(付記8)
第3記憶装置をさらに備え、
前記CPUは、
前記生成ステップにおいて前記第1の障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る第1記憶領域に記録し、
前記縮小ステップにおいて前記第3記憶装置の前記第1記憶領域に記憶された情報を読み出し、当該情報に基づいて前記第2障害情報を生成する
付記7に記載のコンピュータ。
(Appendix 8)
A third storage device;
The CPU
In the generation step, the first failure information is recorded in a first storage area according to a predetermined address and data size of the third storage device,
The computer according to claim 7, wherein information stored in the first storage area of the third storage device is read in the reduction step, and the second failure information is generated based on the information.
(付記9)
前記CPUは、
前記縮小ステップにおいて前記第2の障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る第2記憶領域に記録し、
前記送信ステップにおいて前記第3記憶装置の前記第2記憶領域に記憶された情報を読み出し、読み出された第2障害情報を送信する
付記8に記載のコンピュータ。
(Appendix 9)
The CPU
In the reduction step, the second failure information is recorded in a second storage area according to a predetermined address and data size of the third storage device,
The computer according to claim 8, wherein in the transmission step, the information stored in the second storage area of the third storage device is read and the read second failure information is transmitted.
(付記10)
コンピュータがBIOSの実行により、当該コンピュータに発生した障害に関する第1の障害情報を取得する取得ステップと、
前記第1障害情報のデータ量を縮小した障害情報である第2障害情報を生成する縮小ステップと、
前記第2の障害情報を管理装置に送信する送信ステップと
を含む障害通知方法。
(Appendix 10)
An acquisition step in which the computer acquires first failure information related to a failure that has occurred in the computer by executing the BIOS;
A reduction step of generating second failure information which is failure information obtained by reducing the data amount of the first failure information;
A failure notification method comprising: a transmission step of transmitting the second failure information to a management device.
(付記11)
自装置に発生した障害に関する第1障害情報を取得する取得ステップと、前記第1障害情報のデータ量を解析することで第2障害情報を生成する解析ステップとを実行するコンピュータと、
前記第2障害情報を解析する管理装置と
を備えるコンピュータシステム。
(Appendix 11)
A computer that executes an acquisition step of acquiring first failure information relating to a failure that has occurred in the device itself, and an analysis step of generating second failure information by analyzing a data amount of the first failure information;
A computer system comprising: a management device that analyzes the second failure information.
1 コンピュータ
01 BIOS
02 OS
03 障害情報処理プログラム
100 CPU
101 ログ収集部
102 第1ログ記録部
103 第2ログ取得部
104 送信部
105 第1ログ取得部
106 解析部
107 縮小部
108 第2ログ記録部
200 メインメモリ
300 不揮発メモリ
400 ストレージ
M1 第1記憶領域
M2 第2記憶領域
1
02 OS
03 Fault
101
Claims (10)
前記コンピュータのBIOSによって生成された、自装置に発生した障害に関する第1障害情報を取得する取得ステップと、
前記第1障害情報のデータ量を縮小することで、管理装置に送信するための障害情報である第2障害情報を生成する縮小ステップと
実行させるための障害情報処理プログラム。 On the computer,
An acquisition step of acquiring first failure information related to a failure that has occurred in the device, generated by the BIOS of the computer;
A failure information processing program for executing a reduction step of generating second failure information, which is failure information to be transmitted to the management device, by reducing the data amount of the first failure information.
前記縮小ステップは、前記コンピュータが前記解析ステップによる前記第1障害情報の前記解析の結果に基づいて前記第2障害情報を生成するステップである
請求項1に記載の障害情報処理プログラム。 Causing the computer to further execute an analysis step of analyzing the first failure information;
The failure information processing program according to claim 1, wherein the reduction step is a step in which the computer generates the second failure information based on a result of the analysis of the first failure information by the analysis step.
前記取得ステップは、前記コンピュータが前記記憶装置の前記記憶領域に記憶された情報を取得するステップである
請求項1または請求項2に記載の障害情報処理プログラム。 The first failure information generated by the BIOS is recorded in a storage area according to a predetermined address and data size of a storage device of the computer,
The failure information processing program according to claim 1, wherein the acquisition step is a step in which the computer acquires information stored in the storage area of the storage device.
前記縮小ステップは、前記第1障害情報のうち前記第2障害情報作成されていないログデータに基づいて前記第2障害情報を作成するステップである
請求項3に記載の障害情報処理プログラム。 The first failure information generated by the BIOS associates log data related to a failure with information indicating whether or not the second failure information is created based on the log data,
The failure information processing program according to claim 3, wherein the reduction step is a step of creating the second failure information based on log data for which the second failure information is not created among the first failure information.
前記CPUに、自装置に発生した障害に関する第1の障害情報を生成する生成ステップと、前記第1の障害情報に基づいて生成された第2の障害情報を管理装置に送信する送信ステップとを実行させるためのプログラムを含むBIOSを記憶する第1記憶装置と、
請求項1から請求項4の何れか1項に記載の障害情報処理プログラムを記憶する第2記憶装置と
を備えるコンピュータ。 CPU,
A generation step of generating first failure information related to a failure that has occurred in the own device to the CPU, and a transmission step of transmitting second failure information generated based on the first failure information to the management device. A first storage device for storing a BIOS including a program for execution;
A computer comprising: a second storage device that stores the failure information processing program according to any one of claims 1 to 4.
請求項5に記載のコンピュータ。 The computer according to claim 5, wherein the second storage device stores an OS capable of executing the failure information processing program.
請求項6に記載のコンピュータ。 The computer according to claim 6, wherein the CPU transfers the control right to the BIOS when the failure is detected, and transfers the control right from the BIOS to the OS after execution of the generation step.
前記CPUは、
前記生成ステップにおいて前記第1の障害情報を前記第3記憶装置の所定のアドレスおよびデータサイズに係る第1記憶領域に記録し、
前記縮小ステップにおいて前記第3記憶装置の前記第1記憶領域に記憶された情報を読み出し、当該情報に基づいて前記第2障害情報を生成する
請求項7に記載のコンピュータ。 A third storage device;
The CPU
In the generation step, the first failure information is recorded in a first storage area according to a predetermined address and data size of the third storage device,
The computer according to claim 7, wherein information stored in the first storage area of the third storage device is read in the reduction step, and the second failure information is generated based on the information.
前記第1障害情報のデータ量を縮小した障害情報である第2障害情報を生成する縮小ステップと、
前記第2の障害情報を管理装置に送信する送信ステップと
を含む障害通知方法。 An acquisition step in which the computer acquires first failure information related to a failure that has occurred in the computer by executing the BIOS;
A reduction step of generating second failure information which is failure information obtained by reducing the data amount of the first failure information;
A failure notification method comprising: a transmission step of transmitting the second failure information to a management device.
前記第2障害情報を解析する管理装置と
を備えるコンピュータシステム。 A computer that generates second failure information by analyzing first failure information related to a failure that has occurred in the device;
A computer system comprising: a management device that analyzes the second failure information.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017055756A JP7063445B2 (en) | 2017-03-22 | 2017-03-22 | Fault information processing program, computer, fault notification method, computer system |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2017055756A JP7063445B2 (en) | 2017-03-22 | 2017-03-22 | Fault information processing program, computer, fault notification method, computer system |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JP2018160009A true JP2018160009A (en) | 2018-10-11 |
| JP7063445B2 JP7063445B2 (en) | 2022-05-09 |
Family
ID=63796724
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2017055756A Active JP7063445B2 (en) | 2017-03-22 | 2017-03-22 | Fault information processing program, computer, fault notification method, computer system |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP7063445B2 (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020119173A (en) * | 2019-01-23 | 2020-08-06 | Necプラットフォームズ株式会社 | Information processing device, control method for information processing device, and control program for information processing device |
| CN113806127A (en) * | 2021-09-12 | 2021-12-17 | 济南浪潮数据技术有限公司 | Server log collection method and device and readable storage medium |
| CN115098315A (en) * | 2022-07-27 | 2022-09-23 | 苏州浪潮智能科技有限公司 | CPU test method, system, equipment and storage medium |
| CN115320682A (en) * | 2022-08-03 | 2022-11-11 | 交控科技股份有限公司 | On-site problem rapid analysis method and device applied to rail transit |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011145824A (en) * | 2010-01-13 | 2011-07-28 | Nec Computertechno Ltd | Information processing apparatus, fault analysis method, and fault analysis program |
| JP2011164971A (en) * | 2010-02-10 | 2011-08-25 | Nec Corp | Method for strengthening communication path between bios and bmc, device thereof and program thereof |
| JP2011210064A (en) * | 2010-03-30 | 2011-10-20 | Nec Corp | Log information collection system, device, method and program |
| JP2013025440A (en) * | 2011-07-19 | 2013-02-04 | Hitachi Ltd | Information processor and fault processing method |
| JP2013037421A (en) * | 2011-08-04 | 2013-02-21 | Nec Corp | Information processor, information processing system, message control method and program |
| US20170102985A1 (en) * | 2014-06-24 | 2017-04-13 | Huawei Technologies Co.,Ltd. | Fault processing method, related apparatus, and computer |
-
2017
- 2017-03-22 JP JP2017055756A patent/JP7063445B2/en active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2011145824A (en) * | 2010-01-13 | 2011-07-28 | Nec Computertechno Ltd | Information processing apparatus, fault analysis method, and fault analysis program |
| JP2011164971A (en) * | 2010-02-10 | 2011-08-25 | Nec Corp | Method for strengthening communication path between bios and bmc, device thereof and program thereof |
| JP2011210064A (en) * | 2010-03-30 | 2011-10-20 | Nec Corp | Log information collection system, device, method and program |
| JP2013025440A (en) * | 2011-07-19 | 2013-02-04 | Hitachi Ltd | Information processor and fault processing method |
| JP2013037421A (en) * | 2011-08-04 | 2013-02-21 | Nec Corp | Information processor, information processing system, message control method and program |
| US20170102985A1 (en) * | 2014-06-24 | 2017-04-13 | Huawei Technologies Co.,Ltd. | Fault processing method, related apparatus, and computer |
Cited By (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2020119173A (en) * | 2019-01-23 | 2020-08-06 | Necプラットフォームズ株式会社 | Information processing device, control method for information processing device, and control program for information processing device |
| CN113806127A (en) * | 2021-09-12 | 2021-12-17 | 济南浪潮数据技术有限公司 | Server log collection method and device and readable storage medium |
| CN113806127B (en) * | 2021-09-12 | 2024-02-13 | 济南浪潮数据技术有限公司 | Server log collection method, device and readable storage medium |
| CN115098315A (en) * | 2022-07-27 | 2022-09-23 | 苏州浪潮智能科技有限公司 | CPU test method, system, equipment and storage medium |
| CN115320682A (en) * | 2022-08-03 | 2022-11-11 | 交控科技股份有限公司 | On-site problem rapid analysis method and device applied to rail transit |
| CN115320682B (en) * | 2022-08-03 | 2024-04-26 | 交控科技股份有限公司 | Method and device for rapidly analyzing field problems applied to rail transit |
Also Published As
| Publication number | Publication date |
|---|---|
| JP7063445B2 (en) | 2022-05-09 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP5474982B2 (en) | Evaluating the effectiveness of memory management techniques that use selective mitigation to reduce errors | |
| US11500707B2 (en) | Controller, memory controller, storage device, and method of operating the controller | |
| JP7063445B2 (en) | Fault information processing program, computer, fault notification method, computer system | |
| US10789184B2 (en) | Vehicle control device | |
| US8245085B2 (en) | Dump output control apparatus and dump output control method | |
| JP5694170B2 (en) | Memory management technology that uses selective mitigation to reduce errors | |
| CN113127245B (en) | Method, system and device for processing system management interruption | |
| CN102073578A (en) | System event log recording method | |
| TWI518680B (en) | Method for maintaining file system of computer system | |
| CN110221932B (en) | Computer and its control method | |
| WO2014155228A1 (en) | A primary memory module with a record of usage history and applications of the primary memory module to a computer system | |
| CN119356989B (en) | Server fault information recording method, device, computer equipment and storage medium | |
| CN114385418A (en) | Protection method, device, equipment and storage medium for communication equipment | |
| US12287979B2 (en) | Data storage apparatus and operating method thereof | |
| CN108536545A (en) | The information processing method and device of terminal device | |
| JP6654230B2 (en) | Vehicle control device | |
| JP5427814B2 (en) | Failure analysis information collection device | |
| JP2010056744A (en) | Information processor, image forming apparatus, and program | |
| CN101311909A (en) | Method for diagnosing system abnormality | |
| TW200846901A (en) | Method for diagnosing system abnormality | |
| JP6108909B2 (en) | Data processing apparatus, data processing method, and program | |
| WO2016139774A1 (en) | Information processing device and information processing system | |
| CN112099980A (en) | Server and control method of error event record loading function | |
| CN108415788A (en) | For the data processing equipment and method to being made a response without response processing circuit | |
| CN114840409A (en) | Vehicle machine exception handling method, storage medium, electronic device and handling system |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20200207 |
|
| A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20201228 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20210224 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20210405 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20211005 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20211206 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220104 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220307 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20220322 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20220414 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7063445 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |