JP2009020545A - Anomaly monitoring device for computer - Google Patents
Anomaly monitoring device for computer Download PDFInfo
- Publication number
- JP2009020545A JP2009020545A JP2007180414A JP2007180414A JP2009020545A JP 2009020545 A JP2009020545 A JP 2009020545A JP 2007180414 A JP2007180414 A JP 2007180414A JP 2007180414 A JP2007180414 A JP 2007180414A JP 2009020545 A JP2009020545 A JP 2009020545A
- Authority
- JP
- Japan
- Prior art keywords
- application
- monitoring
- abnormality
- information
- operating system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000012806 monitoring device Methods 0.000 title claims description 7
- 238000012544 monitoring process Methods 0.000 claims abstract description 72
- 230000005856 abnormality Effects 0.000 claims abstract description 44
- 230000006870 function Effects 0.000 claims abstract description 30
- 230000002159 abnormal effect Effects 0.000 claims abstract description 16
- 238000012790 confirmation Methods 0.000 claims abstract description 11
- 230000004044 response Effects 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 230000003247 decreasing effect Effects 0.000 abstract 1
- 238000000034 method Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 4
- 238000004904 shortening Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 238000004883 computer application Methods 0.000 description 1
Images
Landscapes
- Debugging And Monitoring (AREA)
Abstract
Description
本発明は、複数のアプリケーションを搭載したコンピュータの異常監視装置に係り、特にアプリケーションやOSの異常動作を監視する装置に関する。 The present invention relates to an abnormality monitoring apparatus for computers equipped with a plurality of applications, and more particularly to an apparatus for monitoring abnormal operations of applications and OS.
コンピュータの異常動作監視は、一般にはウオッチドッグ機能が使用される。このウオッチドッグ機能による監視方式を図3で説明する。コンピュータのアプリケーション1は、複数のものが搭載され、それらの機能は、オペレーティングシステム(OS)2を介して実行される。アプリケーション1を実行するコンピュータの監視機能として、ウオッチドッグ機能を一定周期で有効にする通知を発生し、この通知がデバイスドライバ2Aを通じてウオッチドッグ機能部3に通知される。ウオッチドッグ機能部3は、コンピュータシステムからの通知が一定時間内にないとき(タイムアウト)にコンピュータの異常動作として検出し、システムをリセットして再起動する。
A watchdog function is generally used for monitoring abnormal operation of a computer. A monitoring method using the watchdog function will be described with reference to FIG. A plurality of
このウオッチドッグ機能による監視方式は、システムの負荷増を防止するためには比較的長い時間(1秒から2秒程度)のタイマ時限に設定されるため、異常発生を迅速に検出できない。また、異常発生原因の特定まではできない。 Since the monitoring method using the watchdog function is set to a timer period of a relatively long time (about 1 to 2 seconds) in order to prevent an increase in the load on the system, the occurrence of an abnormality cannot be detected quickly. Also, it is impossible to identify the cause of the abnormality.
異常発生を迅速に検出する監視方式として、コンピュータシステムのアドレスバス上のアドレスデータを直接に監視し、アドレスデータが割り当てられていないアドレス空間になるときに異常として検出し、CPUに割り込みをかけるものがある(例えば、特許文献1参照)。
前記のように、ウオッチドッグ機能による監視方式は、異常発生を迅速に検出できない。また、ウオッチドッグ機能はタイムアウトとなった場合にCPUに割り込みをかけてシステムを再起動するが、単にアプリケーションからウオッチドッグ機能にタイマ更新の通知がないという場合しか異常検知できない。また、異常が発生したという情報も残すことが困難である。 As described above, the monitoring method using the watchdog function cannot quickly detect the occurrence of an abnormality. When the watchdog function times out, the CPU is interrupted and the system is restarted. However, an abnormality can be detected only when there is no notification of timer update from the application to the watchdog function. It is also difficult to leave information that an abnormality has occurred.
この点、特許文献1の監視方式は、CPUの負荷増を招くことなく、異常発生を迅速に検出でき、また異常が発生したという情報も残すことができるが、アドレス空間の異常監視しかできない。このため、OSやアプリケーション自体の異常動作を監視できない場合があり、さらにいずれのアプリケーションが異常かの特定ができない。
In this regard, the monitoring method of
本発明の目的は、OSやアプリケーションの異常動作を早期に検出でき、またシステムのCPU負担を下げながら、異常動作したアプリケーションを特定できるコンピュータの異常監視装置を提供することにある。 An object of the present invention is to provide an abnormality monitoring apparatus for a computer that can detect an abnormal operation of an OS or an application at an early stage and can identify an abnormally operated application while reducing the CPU load of the system.
本発明は、前記の課題を解決するため、アプリケーション別に個々に定めた時間により異常の有無を監視し、またはアプリケーション別の個々の動作確認により異常の有無を監視し、これら監視をローカルCPUで行うようにしたもので、以下の構成を特徴とする。 In order to solve the above problems, the present invention monitors the presence / absence of an abnormality by a time determined individually for each application, or monitors the presence / absence of an abnormality by an individual operation check for each application, and performs these monitoring by a local CPU. As described above, it has the following configuration.
(1)複数のアプリケーションを搭載したコンピュータシステムの異常動作を監視する異常監視装置であって、
各アプリケーションは、自アプリケーションを特定する情報と、アプリケーション別の監視タイムアウト時間を記載したアプリケーション情報を、ウオッチドッグ機能を有効にする要求として発行する手段を備え、
前記アプリケーション情報をオペレーティングシステムのデバイスドライバを通じて与えられ、これを順次記憶するFIFOメモリを備え、
前記FIFOメモリからアプリケーション情報を順次読み出し、アプリケーション別の前記時間についてウオッチドッグ監視を行い、この時間内に当該アプリケーションから次回の通知がないときに、当該アプリケーションの異常として検出するローカルCPUを備えたことを特徴とする。
(1) An abnormality monitoring apparatus for monitoring abnormal operation of a computer system having a plurality of applications,
Each application has means for issuing information for identifying its own application and application information describing the monitoring timeout period for each application as a request to enable the watchdog function.
The application information is provided through a device driver of an operating system, and includes a FIFO memory that sequentially stores the application information.
It has a local CPU that sequentially reads application information from the FIFO memory, performs watchdog monitoring of the time for each application, and detects an abnormality of the application when there is no next notification from the application within this time It is characterized by.
(2)複数のアプリケーションを搭載したコンピュータシステムの異常動作を監視する異常監視装置であって、
各アプリケーションは、自アプリケーションを特定する情報を付した「監視機能を有効にする要求」を発行し、この後にアプリケーション別に定める一定周期で「動作中」通知を発行する手段を備え、
前記アプリケーションから発行された、「監視機能を有効にする要求」と「動作中」通知を受け、これら情報をオペレーティングシステム2を通してローカルCPUに通知する監視エージェントを備え、
前記ローカルCPUは、前記監視エージェントから「監視機能を有効にする要求」を受けたときに当該アプリケーションの異常監視に入り、前記「動作中」通知があるときにオペレーティングシステムおよび前記監視エージェントに「確認通知」を発行し、この「確認通知」に対して前記オペレーティングシステムおよび監視エージェントから「応答通知」が返されたときにオペレーティングシステムおよびアプリケーションおよび監視エージェントが正常に動作可能状態であると判断する手段を備えたことを特徴とする。
(2) An abnormality monitoring device for monitoring abnormal operation of a computer system equipped with a plurality of applications,
Each application is provided with a means for issuing a “request for enabling the monitoring function” with information identifying its own application, and thereafter issuing a “working” notification at a fixed period determined for each application.
A monitoring agent that receives a "request for enabling monitoring function" and "in operation" notifications issued from the application and notifies the local CPU of these information through the
When the local CPU receives a “request to enable the monitoring function” from the monitoring agent, the local CPU enters an abnormality monitoring of the application, and when there is a notification of “in operation”, the local CPU performs “confirmation” to the operating system and the monitoring agent. Means for determining that the operating system, the application, and the monitoring agent are normally operable when the “response notification” is returned from the operating system and the monitoring agent in response to the “confirmation notification”. It is provided with.
(3)前記ローカルCPUは、アプリケーションまたはオペレーティングシステムの異常を判断したときに、不揮発性メモリにその旨の情報を記憶しておく手段を備えたことを特徴とする。 (3) The local CPU includes means for storing information to that effect in a nonvolatile memory when an abnormality of an application or an operating system is determined.
以上のとおり、本発明によれば、アプリケーション別に個々に定めた時間により異常の有無を監視し、またはアプリケーション別の個々の動作確認により異常の有無を監視し、これら監視をローカルCPUで行うようにしたため、OSやアプリケーションの異常動作を早期に検出でき、またシステムのCPU負担を下げながら、異常動作したアプリケーションを特定できる。 As described above, according to the present invention, the presence or absence of an abnormality is monitored by a time determined individually for each application, or the presence or absence of an abnormality is monitored by individual operation confirmation for each application, and these monitoring are performed by the local CPU. Therefore, the abnormal operation of the OS or application can be detected at an early stage, and the abnormally operated application can be specified while reducing the CPU load of the system.
(実施形態1)
図1は、本発明の実施形態を示す異常監視装置の要部構成図である。コンピュータシステムは複数のアプリケーション1A〜1Cと、オペレーティングシステム(OS)2によって構築されものとする。このコンピュータシステムの監視装置として、本実施形態では、FIFO(First in First out)メモリ4とローカルCPU5と不揮発性メモリ6により異常監視機能を実現する。
(Embodiment 1)
FIG. 1 is a main part configuration diagram of an abnormality monitoring apparatus showing an embodiment of the present invention. The computer system is constructed by a plurality of
本実施形態による異常監視処理を以下に説明する。 The abnormality monitoring process according to this embodiment will be described below.
(S1)アプリケーション1A〜1Cは、その実行時など適当な時点で、自アプリケーションを特定する情報(ここではIDとする)と、アプリケーション別に個々に定めた監視タイムアウト時間を記載したアプリケーション情報を付して、ウオッチドッグ機能を有効にする要求を発行する。
(S1) Each of the
(S2)ウオッチドッグ機能を有効にする発行の通知(アプリケーション情報つき)は、オペレーティングシステム2がデバイスドライバ2Aを通じてFIFOメモリ4に書き込む。この通知は、アプリケーション1A〜1Cから要求が発行される度に、FIFOメモリ4に順次蓄積される。
(S2) The issuance notification (with application information) for enabling the watchdog function is written into the
(S3)ローカルCPU5は、FIFOメモリ4からアプリケーション情報を順次読み出し、ID別にアプリケーションに個々に定めた時間情報についてウオッチドッグ機能による監視を行う。この監視で、各IDについて個々に定めた時間内に当該アプリケーションから次回の通知がないときに、当該IDをもつアプリケーションの異常として検出し、不揮発性メモリ6にその旨の情報を書き込んで保存すると共に、オペレーティングシステム2へのNMI割り込みなどによって、システムの再起動などを要求する。
(S3) The local CPU 5 sequentially reads the application information from the
したがって、本実施形態によれば、ローカルCPU5は、アプリケーション別に定めた時間(ウオッチドッグタイマ)でかつアプリケーションを特定して個々に異常監視ができ、いずれのアプリケーションに異常発生したかを検出、記憶することができる。この詳細な異常状態の記憶により、異常状態の解析も可能となる。 Therefore, according to the present embodiment, the local CPU 5 can monitor an abnormality individually by specifying the application at a time (watchdog timer) determined for each application, and detect and store which application has an abnormality. be able to. By storing the detailed abnormal state, it is possible to analyze the abnormal state.
また、頻繁に起動されるアプリケーションでは、それに定めるウオッチドッグタイマ時間を短くすることで、迅速な異常検出とシステム保護ができる。また、さらに、ローカルCPUによる異常監視により、オペレーティングシステム側のメインCPUの負担を軽減することができる。 In applications that are frequently started, it is possible to quickly detect anomalies and protect the system by shortening the watchdog timer time. Furthermore, the load on the main CPU on the operating system side can be reduced by monitoring the abnormality by the local CPU.
また、各アプリケーションからの通知は、オペレーティングシステム2を通して与えられることから、オペレーティングシステム2の異常動作も含めた監視ができる。
Further, since the notification from each application is given through the
(実施形態2)
図2は、本発明の実施形態を示す異常監視装置の構成図である。コンピュータシステムは複数のアプリケーション1A、1Bと、オペレーティングシステム(OS)2によって構築されるものとする。このコンピュータシステムの監視装置として、本実施形態では、監視エージェント(プログラム)7とローカルCPU8と不揮発性メモリ9により異常監視機能を実現する。
(Embodiment 2)
FIG. 2 is a configuration diagram of the abnormality monitoring apparatus showing the embodiment of the present invention. The computer system is constructed by a plurality of
本実施形態による異常監視処理を以下に説明する。 The abnormality monitoring process according to this embodiment will be described below.
(S11)アプリケーション1A,1Bは、その実行時など適当な時点で、自アプリケーションを特定する情報(ここではIDとする)と、監視機能を有効にする要求を監視エージェント7に発行する。
(S11) The
(S12)監視機能を有効にする要求(アプリケーションID情報つき)を通知された監視エージェント7は、オペレーティングシステム2とデバイスドライバ2Aを通じて、ローカルCPU8に通知する。
(S12) The
(S13)ローカルCPU8は、監視機能を有効にする要求の通知を、アプリケーションのIDで記憶しておく。
(S13) The
(S14)アプリケーションは、監視機能を有効にする要求を発行した後、一定周期(アプリケーション別に定めた時間)でID情報と共に監視エージェント7に動作中であることの「動作中」通知を発行する。
(S14) After issuing the request for enabling the monitoring function, the application issues an “in operation” notification that the operation is being performed to the
(S15)ローカルCPU8は、アプリケーションの「動作中」通知を監視エージェントからオペレーティングシステム2を介して受けたとき、一定周期でオペレーティングシステム2に「確認通知」を発行する。
(S15) The
(S16)オペレーティングシステム2は、直ちに「確認通知」の「受領通知」をローカルCPU8に通知する。この通知をもって、ローカルCPU8はオペレーティングシステム2が正常に稼動していると判断する。オペレーティングシステム2が稼動状態で無い場合、ローカルCPU8は不揮発性メモリ9にその旨の情報を書き込む。
(S16) The
(S17)ローカルCPU8からの「確認通知」は、オペレーティングシステム2から監視エージェント7に通知する。
(S 17) “Confirmation notification” from the
(S18)監視エージェント7は、オペレーティングシステム2を介してローカルCPU8からの「確認通知」を受けたとき、アプリケーションID毎の稼動情報とともに「応答通知」をオペレーティングシステム2を通してローカルCPU8側に返す。
(S18) When the
(S19)ローカルCPU8は、「応答通知」があることでオペレーティングシステム2およびアプリケーションおよび監視エージェント7が正常に動作可能状態であると判断する。
(S19) The
アプリケーションまたは監視エージェント7が正常な稼動状態で無い場合、ローカルCPU8は、不揮発性メモリ9にその旨の情報を記憶する。また、アプリケーション毎の稼動状態をチェックし、該当アプリケーションが稼動状態で無い場合は不揮発性メモリ9にその旨の情報を記憶する。
When the application or the
(S20)ローカルCPU8は、監視した状態、情報を何らかの通信経路で他のCPUへ通知する。
(S20) The
したがって、本実施形態によれば、アプリケーションとオペレーティングシステム2およびローカルCPUとの間で、「応答通知」と「確認通知」のやり取りにより異常監視を行うため、OSレベルの稼動状態の検出、記録、アプリケーションレベル(監視エージェント)の稼動状態の検出、記録、また、個々のアプリケーションプロゲラムの稼動状態の検出、記録をすることができる。また、詳細な情報が得られることにより異常状態の解析も可能となる。
Therefore, according to the present embodiment, the abnormality monitoring is performed by exchanging “response notification” and “confirmation notification” between the application and the
また、実施形態1と同様に、頻繁に起動されるアプリケーションでは、それに定める一定周期の通知時間を短くすることで、迅速な異常検出とシステム保護ができる。また、さらに、ローカルCPUによる異常監視により、オペレーティングシステム側のメインCPUの負担を軽減することができる。 Similarly to the first embodiment, an application that is frequently started can quickly detect an abnormality and protect the system by shortening the notification time of a predetermined period. Furthermore, the load on the main CPU on the operating system side can be reduced by monitoring the abnormality by the local CPU.
1A〜1C アプリケーション
2 オペレーティングシステム
2A デバイスドライバ
4 FIFOメモリ
5 ローカルCPU
6 不揮発性メモリ
7 監視エージェント
8 ローカルCPU
1A to
6
Claims (3)
各アプリケーションは、自アプリケーションを特定する情報と、アプリケーション別の監視タイムアウト時間を記載したアプリケーション情報を、ウオッチドッグ機能を有効にする要求として発行する手段を備え、
前記アプリケーション情報をオペレーティングシステムのデバイスドライバを通じて与えられ、これを順次記憶するFIFOメモリを備え、
前記FIFOメモリからアプリケーション情報を順次読み出し、アプリケーション別の前記時間についてウオッチドッグ監視を行い、この時間内に当該アプリケーションから次回の通知がないときに、当該アプリケーションの異常として検出するローカルCPUを備えたことを特徴とするコンピュータの異常監視装置。 An abnormality monitoring device that monitors abnormal operation of a computer system equipped with a plurality of applications,
Each application includes means for issuing information for identifying its own application and application information describing the monitoring timeout period for each application as a request to enable the watchdog function.
The application information is provided through an operating system device driver, and includes a FIFO memory for sequentially storing the application information,
A local CPU is provided that sequentially reads application information from the FIFO memory, performs watchdog monitoring of the time for each application, and detects that there is no next notification from the application within this time. An abnormality monitoring apparatus for a computer characterized by the above.
各アプリケーションは、自アプリケーションを特定する情報を付した「監視機能を有効にする要求」を発行し、この後にアプリケーション別に定める一定周期で「動作中」通知を発行する手段を備え、
前記アプリケーションから発行された、「監視機能を有効にする要求」と「動作中」通知を受け、これら情報をオペレーティングシステム2を通してローカルCPUに通知する監視エージェントを備え、
前記ローカルCPUは、前記監視エージェントから「監視機能を有効にする要求」を受けたときに当該アプリケーションの異常監視に入り、前記「動作中」通知があるときにオペレーティングシステムおよび前記監視エージェントに「確認通知」を発行し、この「確認通知」に対して前記オペレーティングシステムおよび監視エージェントから「応答通知」が返されたときにオペレーティングシステムおよびアプリケーションおよび監視エージェントが正常に動作可能状態であると判断する手段を備えたことを特徴とするコンピュータの異常監視装置。 An abnormality monitoring device that monitors abnormal operation of a computer system equipped with a plurality of applications,
Each application is provided with a means for issuing a “request for enabling the monitoring function” with information for identifying its own application and thereafter issuing a “working” notification at a fixed period determined for each application.
A monitoring agent that receives a "request for enabling the monitoring function" and "in operation" notifications issued from the application and notifies the local CPU of these information through the operating system 2;
When the local CPU receives a “request to enable the monitoring function” from the monitoring agent, the local CPU enters an abnormality monitoring of the application, and when there is a notification of “in operation”, the local CPU performs “confirmation” to the operating system and the monitoring agent. Means for determining that the operating system, the application, and the monitoring agent are normally operable when the “response notification” is returned from the operating system and the monitoring agent in response to the “confirmation notification”. An abnormality monitoring apparatus for a computer, comprising:
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007180414A JP2009020545A (en) | 2007-07-10 | 2007-07-10 | Anomaly monitoring device for computer |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007180414A JP2009020545A (en) | 2007-07-10 | 2007-07-10 | Anomaly monitoring device for computer |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2009020545A true JP2009020545A (en) | 2009-01-29 |
Family
ID=40360161
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2007180414A Pending JP2009020545A (en) | 2007-07-10 | 2007-07-10 | Anomaly monitoring device for computer |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2009020545A (en) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11650823B2 (en) | 2019-09-27 | 2023-05-16 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program |
-
2007
- 2007-07-10 JP JP2007180414A patent/JP2009020545A/en active Pending
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US11650823B2 (en) | 2019-09-27 | 2023-05-16 | Fujifilm Business Innovation Corp. | Information processing apparatus and non-transitory computer readable medium storing information processing program |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US7716520B2 (en) | Multi-CPU computer and method of restarting system | |
| TW476877B (en) | Method for monitoring fault of operating system and application program | |
| EP3025233B1 (en) | Robust hardware/software error recovery system | |
| JP2007109238A (en) | System and method for logging recoverable error | |
| US20170147422A1 (en) | External software fault detection system for distributed multi-cpu architecture | |
| KR101581608B1 (en) | Processor system | |
| US20170149925A1 (en) | Processing cache data | |
| JP5183542B2 (en) | Computer system and setting management method | |
| JP6130520B2 (en) | MULTISYSTEM SYSTEM AND MULTISYSTEM SYSTEM MANAGEMENT METHOD | |
| CN111796954A (en) | Watchdog control method, device, equipment and storage medium based on JVM | |
| CN105302768A (en) | Slave CPU exception processing method and apparatus | |
| JP4886558B2 (en) | Information processing device | |
| JP5141381B2 (en) | Information processing apparatus, error notification program, and error notification method | |
| US20050033952A1 (en) | Dynamic scheduling of diagnostic tests to be performed during a system boot process | |
| JP2009223582A (en) | Information processor, control method for information processor and control program | |
| JP4462238B2 (en) | Mobile device | |
| JP6504610B2 (en) | Processing device, method and program | |
| JP2009020545A (en) | Anomaly monitoring device for computer | |
| JP4836732B2 (en) | Information processing device | |
| JP2006338445A (en) | Abnormal information storage device | |
| JP7001236B2 (en) | Information processing equipment, fault monitoring method, and fault monitoring computer program | |
| JP4867896B2 (en) | Information processing system | |
| JPWO2014112039A1 (en) | Information processing apparatus, information processing apparatus control method, and information processing apparatus control program | |
| JP6788145B2 (en) | Processing equipment, traffic signal equipment and information display equipment | |
| CN108415788B (en) | Data processing apparatus and method for responding to non-responsive processing circuitry |