JPWO2010131425A1 - Sequentially generated data analysis apparatus, system, method, and program - Google Patents
Sequentially generated data analysis apparatus, system, method, and program Download PDFInfo
- Publication number
- JPWO2010131425A1 JPWO2010131425A1 JP2011513230A JP2011513230A JPWO2010131425A1 JP WO2010131425 A1 JPWO2010131425 A1 JP WO2010131425A1 JP 2011513230 A JP2011513230 A JP 2011513230A JP 2011513230 A JP2011513230 A JP 2011513230A JP WO2010131425 A1 JPWO2010131425 A1 JP WO2010131425A1
- Authority
- JP
- Japan
- Prior art keywords
- analysis
- data
- analyzed
- unit
- sequential generation
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 178
- 238000000034 method Methods 0.000 title claims abstract description 176
- 238000004458 analytical method Methods 0.000 claims abstract description 1356
- 230000008569 process Effects 0.000 claims abstract description 142
- 238000012545 processing Methods 0.000 claims abstract description 95
- 238000012544 monitoring process Methods 0.000 claims description 134
- 238000004364 calculation method Methods 0.000 claims description 49
- 230000010365 information processing Effects 0.000 claims description 35
- 238000012882 sequential analysis Methods 0.000 claims description 2
- 238000010586 diagram Methods 0.000 description 31
- 230000006870 function Effects 0.000 description 27
- 230000004044 response Effects 0.000 description 27
- 238000013500 data storage Methods 0.000 description 26
- 238000007726 management method Methods 0.000 description 15
- 239000000284 extract Substances 0.000 description 11
- 230000008859 change Effects 0.000 description 10
- 238000001514 detection method Methods 0.000 description 8
- 238000005206 flow analysis Methods 0.000 description 4
- 238000012546 transfer Methods 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 3
- 239000006185 dispersion Substances 0.000 description 2
- 230000014509 gene expression Effects 0.000 description 2
- 230000001174 ascending effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013075 data extraction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000012913 prioritisation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G08—SIGNALLING
- G08G—TRAFFIC CONTROL SYSTEMS
- G08G1/00—Traffic control systems for road vehicles
- G08G1/09—Arrangements for giving variable traffic instructions
- G08G1/091—Traffic information broadcasting
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Debugging And Monitoring (AREA)
- Information Transfer Between Computers (AREA)
Abstract
逐次発生データ解析装置は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を備えたことを特徴とする。逐次発生データ解析システムは、逐次発生するデータである逐次発生データを発生するデータ発生装置と、前記データ発生手段が発生する前記逐次発生データの解析処理を実行する逐次発生データ解析装置と、前記逐次発生データ解析装置の解析結果に基づいて、データ解析サービスを提供する処理を実行するサービス提供装置とを備え、前記逐次発生データ解析装置は、解析要求よりも前に、前記逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を含むことを特徴とする。The sequential generation data analyzing apparatus includes a prior analysis control unit that performs control to execute a process of performing preliminary analysis on sequential generation data that is sequentially generated before an analysis request. The sequential generation data analysis system includes a data generation device that generates sequential generation data that is sequentially generated data, a sequential generation data analysis device that performs an analysis process of the sequential generation data generated by the data generation unit, and the sequential generation data A service providing device that executes processing for providing a data analysis service based on the analysis result of the generated data analyzing device, and the sequential generated data analyzing device analyzes the sequentially generated data in advance prior to the analysis request. It includes a pre-analysis control means for performing control to execute the processing to be performed.
Description
本発明は、逐次的に発生するデータを収集して解析する逐次発生データ解析装置、逐次発生データ解析システム、逐次発生データ解析方法、及び逐次発生データ解析プログラムに関する。 The present invention relates to a sequential generation data analysis apparatus, a sequential generation data analysis system, a sequential generation data analysis method, and a sequential generation data analysis program that collect and analyze sequentially generated data.
高速にデータを解析する関連技術として、例えば、特許文献1には、キャッシュサーバを用いてデータ解析を行うキャッシュ制御装置が記載されている。図31は、特許文献1に記載されたキャッシュ制御装置の構成を示すブロック図である。図31に示すように、特許文献1に記載されたキャッシュ制御装置は、データを解析する解析サーバを備えるとともに、解析結果を利用するサービス提供端末との間に、解析結果を記憶しておき2次利用するキャッシュサーバを備える。そのような構成を備えることによって、サービス提供端末が同じクエリを発行した場合、2回目以降に発行されるクエリに対しては、キャッシュサーバが記憶する以前の解析結果を利用することにより、解析サーバが毎回解析を行う必要をなくすことができ、ある程度データ解析の高速化を期待できる。
As a related technique for analyzing data at high speed, for example,
しかし、特許文献1に記載された関連技術では、1度目のクエリは高速化されないという問題がある。従って、キャッシュサーバは、同じクエリを何度も発行するようなアプリケーションでしかデータ解析の高速化を行うことはできない。例えば、キャッシュを利用したWebページの閲覧を例に考えると、まだ誰も見ていないWebページへのアクセスを高速化することはできない。つまり、多くのユーザが同じクエリを何度も発行するといった利用環境においてのみ、データ解析の高速化を期待できる。
However, the related technique described in
一方、例えば、サーバが蓄積するログデータやセンサが検出するデータ等逐次的に発生するデータを解析対象とする場合には、最新のデータを1度だけ解析することが多い。従って、特許文献1に記載された関連技術を用いたとしても、データ解析の高速化の効果が低い。
On the other hand, for example, when sequentially generated data such as log data accumulated by a server or data detected by a sensor is to be analyzed, the latest data is often analyzed only once. Therefore, even if the related technique described in
また、特許文献1に記載された関連技術では、解析対象のデータに変化がないことが前提である。そのため、新たなデータが追加された場合、同じクエリに対してデータ解析を行った場合であっても解析結果が変化する可能性があり、キャッシュサーバのデータを二次利用することはできない。
Further, in the related technique described in
一方、例えば、サーバが蓄積するログデータやセンサが検出するデータ等の逐次的に発生するデータを対象とする場合には、解析対象のデータが常に変化している。従って、特許文献1に記載された関連技術を用いたとしても、キャッシュサーバで記憶した解析結果を2次利用する機会はなく、毎回、解析サーバが解析処理を実行する必要がある。そのため、データ解析の高速化を図ることはできない。
On the other hand, for example, when data generated sequentially such as log data accumulated by a server or data detected by a sensor is targeted, the data to be analyzed is constantly changing. Therefore, even if the related technique described in
以上のように、サーバが蓄積するログデータやセンサが検出するデータ等、逐次的に発生するデータを収集して解析する状況においてデータ解析を行う場合には、特許文献1に記載された関連技術を用いたとしても、解析対象のデータを高速に解析することはできない。
As described above, when data analysis is performed in a situation where data generated sequentially, such as log data accumulated by a server or data detected by a sensor, is analyzed, the related technique described in
そこで、本発明は、逐次的に発生するデータを収集して解析する場合であっても、サービス毎のレスポンスタイムの要望に応じた解析を行うことができる逐次発生データ解析装置、逐次発生データ解析システム、逐次発生データ解析方法、及び逐次発生データ解析プログラムを提供することを目的とする。 Accordingly, the present invention provides a sequential data analysis apparatus and a sequential data analysis that can perform analysis according to a request for response time for each service even when collecting and analyzing data that occurs sequentially. An object is to provide a system, a sequential generation data analysis method, and a sequential generation data analysis program.
本発明による逐次発生データ解析装置は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を備えたことを特徴とする。 The sequential generation data analysis apparatus according to the present invention is characterized by including a prior analysis control unit that performs control to execute a process of performing prior analysis on sequential generation data that is sequentially generated before an analysis request.
本発明による逐次発生データ解析システムは、逐次発生するデータである逐次発生データを発生するデータ発生装置と、データ発生手段が発生する逐次発生データの解析処理を実行する逐次発生データ解析装置と、逐次発生データ解析装置の解析結果に基づいて、データ解析サービスを提供する処理を実行するサービス提供装置とを備え、逐次発生データ解析装置は、解析要求よりも前に、逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を含むことを特徴とする。 A sequential generation data analysis system according to the present invention includes a data generation device that generates sequential generation data that is data that is generated sequentially, a sequential generation data analysis device that performs analysis processing of sequential generation data generated by the data generation means, And a service providing device that executes a process for providing a data analysis service based on the analysis result of the generated data analysis device. The sequential generated data analysis device performs a process of pre-analyzing sequentially generated data before an analysis request. It includes a pre-analysis control means for performing control to execute the above.
本発明による逐次発生データ解析方法は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御ステップを含むことを特徴とする。 The sequential generation data analysis method according to the present invention includes a pre-analysis control step for performing control for executing a process of pre-analyzing sequential generation data that is sequentially generated before an analysis request.
本発明による逐次発生データ解析プログラムは、コンピュータに、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御処理を実行させるためのものである。 The sequential generation data analysis program according to the present invention is for causing a computer to execute a pre-analysis control process for performing a control for executing a process of pre-analyzing sequential generation data that is sequentially generated before an analysis request. It is.
本発明によれば、逐次的に発生するデータを収集して解析する場合であっても、サービス毎のレスポンスタイムの要望に応じた解析を行うことができる。 According to the present invention, even in the case of collecting and analyzing sequentially generated data, it is possible to perform analysis in response to a request for response time for each service.
実施形態1.
以下、本発明の第1の実施形態について図面を参照して説明する。図1は、本発明による逐次発生データ解析システムの構成の一例を示すブロック図である。図1に示すように、逐次発生データ解析システムは、サービス提供手段1、サービス要件設定手段2、解析データ発生手段3、解析データ記憶手段4、解析手段5、解析命令受付手段6、解析結果記憶手段7、及び事前解析制御手段8を含む。なお、本実施形態において、逐次発生データ解析システムは、プログラムに従って動作するパーソナルコンピュータ等の複数の情報処理装置を用いて実現される。
Hereinafter, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing an example of the configuration of a sequential generation data analysis system according to the present invention. As shown in FIG. 1, the sequential generation data analysis system includes a
なお、本実施形態において、逐次発生データ解析システムは、例えば、Webデータが発生するログデータに基づいて、Webアクセスの動線解析を行う用途に適用できる。また、逐次発生データ解析システムは、例えば、交通情報(例えば、道路上の自動車の位置情報)を収集し、道路上の渋滞箇所を検出して提供する渋滞情報提供システムの用途に適用できる。また、例えば、逐次発生データ解析システムは、株価の変動を監視し、株価の変動と事前入力した売買ルールとをマッチングして、株式の自動売買を行うアルゴリズムトレードの用途に適用できる。すなわち、逐次発生データ解析システムは、大量のデータが逐次的に発生し、最新のデータをリアルタイムに反映しながら解析を行うあらゆるシステムに適用可能である。 In the present embodiment, the sequential data analysis system can be applied, for example, to a use for performing a flow analysis of web access based on log data generated from web data. The sequential generation data analysis system can be applied to, for example, a traffic information providing system that collects traffic information (for example, position information of automobiles on a road) and detects and provides a traffic jam location on the road. In addition, for example, the sequential data analysis system can be applied to the use of algorithmic trading in which stock price fluctuations are monitored, stock price fluctuations are matched with pre-entered trading rules, and automatic stock trading is performed. That is, the sequential generation data analysis system can be applied to any system that generates a large amount of data sequentially and performs analysis while reflecting the latest data in real time.
サービス提供手段1は、具体的には、プログラムに従って動作する情報処理装置のCPU及びネットワークインタフェース部によって実現される。サービス提供手段1は、サーバが出力するログデータやセンサ(例えば、温度センサや湿度センサ)が出力するデータ等、逐次的に発生するデータを収集して解析する機能を備える。また、サービス提供手段1は、様々なサービスを一般ユーザに提供する装置(例えば、Webサーバ)を運営する事業者ユーザ(例えば、Webサイトのオーナ)に対して、データの解析結果を用いてデータ解析サービス(例えば、解析結果の配信サービス)を提供する機能を備える。
Specifically, the
サービス要件設定手段2は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。サービス要件設定手段2は、サービス提供手段1が提供するサービス毎に、サービスのレスポンスタイムの要件(以下、サービス要件ともいう)を設定し、設定内容を記憶装置(例えば、情報処理装置が備える磁気ディスク装置や光ディスク装置)に記憶する機能を備える。なお、サービス要件とは、後述する事前解析対象のデータとするか否かを示す要件や、事前解析を行う優先度を示す要件のことである。サービス要件設定手段2は、例えば、Webサーバを運営する事業者ユーザの設定要求に従って、サービス要件を設定し、設定内容を記憶装置に記憶する。
Specifically, the service
解析データ発生手段3は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。解析データ発生手段3は、サーバが出力するログデータやセンサが出力するデータ等、解析対象のデータを逐次的に発生させる機能を備える。なお、本実施形態では、時系列に逐次的に発生するデータを解析する場合を示しているが、何らかの順序性をもつデータであれば、例えば、距離が近い順や遠い順等の位置的な順序性をもったデータを逐次的に入力して解析を行う場合にも適用できる。また、短い時間間隔(例えば、数秒間隔)で連続して発生されるデータに限らず、逐次的に発生するデータであれば、例えば、数時間や数日等の長い時間間隔で発生するデータや、発生間隔が一定しないようなデータを入力して解析を行う場合にも適用できる。
Specifically, the analysis
解析データ記憶手段4は、具体的には、情報処理装置が備えるメモリ等の一時記憶装置によって実現される。解析データ記憶手段4は、解析データ発生手段3が発生するデータを記憶する。このように、本実施形態では、逐次発生データ解析システムは、解析データ発生手段3が発生するデータを磁気ディスク装置や光ディスク装置等のデータベース装置に蓄積してから解析するのではなく、メモリ等の一時記憶装置等に一旦記憶するのみでリアルタイムに高速解析を行う。
Specifically, the analysis
解析手段5は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。解析手段5は、解析データ記憶手段4に記憶されたデータを解析する機能を備える。
Specifically, the
事前解析制御手段8は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。事前解析制御手段8は、サービス要件設定手段2によって設定されたサービス要件に従って、解析データ記憶手段4が記憶するデータの中から事前解析対象のデータを選択し、サービス提供手段1から解析要求のクエリを入力する前に事前解析を実行する制御(解析手段5に解析処理を実行させる)を行う機能を備える。なお、本実施形態において、「事前解析」とは、解析要求がされるよりも前に予めデータを解析しておくことをいう。
Specifically, the
解析結果記憶手段7は、具体的には、情報処理装置が備えるメモリ等の一時記憶装置によって実現される。解析結果記憶手段7は、事前解析制御手段8が求めた事前解析結果を記憶する。
Specifically, the analysis
解析命令受付手段6は、具体的には、プログラムに従って動作する情報処理装置のCPU及びネットワークインタフェース部によって実現される。解析命令受付手段6は、サービス提供手段1から解析要求のクエリを受け取る(入力又は受信する)機能を備える。また、解析命令受付手段6は、この解析要求のクエリに対する回答情報(解析結果)の作成するために、解析結果記憶手段7が記憶する事前解析結果を用いるのか、解析手段5に解析処理を実行させるのかを判断する機能を備える。また、解析命令受付手段6は、解析結果記憶手段7が記憶する事前解析結果、又は解析手段5が実行した解析結果のいずれかを、解析要求のクエリに対する回答情報として、サービス提供手段1に出力(又は送信)する機能を備える。
Specifically, the analysis command receiving means 6 is realized by a CPU and a network interface unit of an information processing apparatus that operates according to a program. The analysis
次に、逐次発生データ解析システムの物理的なサーバ構成について説明する。図2は、逐次発生データ解析システムの物理的なサーバ構成の例を示すブロック図である。図2に示すように、逐次発生データ解析システムは、例えば、アプリケーションサーバ101、解析サーバ102、データ解析サービスサーバ103、データ解析受付サーバ104、及びデータ高速解析サーバ105を含む。
Next, the physical server configuration of the sequential generation data analysis system will be described. FIG. 2 is a block diagram illustrating an example of a physical server configuration of the sequential data analysis system. As shown in FIG. 2, the sequential data analysis system includes, for example, an
アプリケーションサーバ101は、例えば、不特定多数の一般ユーザに対して各種Webサービスを提供する事業者ユーザが運営するサーバ(例えば、Webサーバ)であり、解析データ発生手段3及び解析データ記憶手段4を含む。アプリケーションサーバ101は、解析データ発生手段3と解析データ記憶手段4とを用いて動作することによって、解析対象のログデータを発生し解析データ記憶手段4に一時蓄積する。
The
解析サーバ102は、例えば、逐次発生データの解析サービスを提供する事業者が運営するサーバであり、解析手段5を含む。解析サーバ102は、解析手段5を用いて動作することによって、アプリケーションサーバ11が発生したデータ(例えば、ログデータ)を解析する。
The
データ解析サービスサーバ103は、例えば、逐次発生データの解析サービスを提供する事業者が運営するサーバであり、サービス提供手段1及びサービス要件設定手段2を含む。データ解析サービスサーバ103は、サービス提供手段1とサービス要件設定手段2とを用いて動作することによって、データ解析結果を、アプリケーションサーバ101を運営する事業者ユーザに提供する処理を行う。
The data
データ解析受付サーバ104は、例えば、逐次発生データの解析サービスを提供する事業者が運営するサーバであり、解析命令受付手段6を含む。データ解析受付サーバ104は、解析命令受付手段6を用いて動作することによって、データ解析サービスサーバ103から解析要求のクエリを受け付ける(受信する)処理を行う。
The data analysis reception server 104 is, for example, a server that is operated by a business provider that provides an analysis service for sequentially generated data, and includes analysis command reception means 6. The data analysis reception server 104 operates using the analysis command reception means 6 to perform processing for receiving (receiving) an analysis request query from the data
データ高速解析サーバ105は、例えば、逐次発生データの解析サービスを提供する事業者が運営するサーバであり、解析結果記憶手段7及び事前解析制御手段8を含む。データ高速解析サーバ105は、解析結果記憶手段7と事前解析制御手段8とを用いて動作することによって、データ解析サービスサーバ103からサービス要件を受け取る(入力する)。また、データ高速解析サーバ105は、入力したサービス要件に応じて、解析要求のクエリが発行される前に、アプリケーションサーバ101が発生するデータを事前に解析するために解析サーバ102を制御する。
The high-speed
なお、図2に示した各サーバ101〜105は、必ずしもそれぞれ別の情報処理装置を用いて実現される必要はなく、サーバの能力に応じて、図2に示した各サーバ101〜105のうちのいずれか複数を1つの情報処理装置を用いて実現してもよい。例えば、多くの場合、解析サーバ102、データ解析受付サーバ104、及びデータ高速解析サーバ105を、同じ1つの情報処理装置によって実現することができる。
Note that the
また、図2に示した各サーバ101〜105や各手段1〜8の間では、通信が必要なネットワークやポート番号等の設定が事前に共有されているものとし、互いに通信できるものとする。
In addition, it is assumed that the
また、図2に示す例において、逐次発生データ解析装置は、例えば、データ高速解析サーバ105によって実現される。また、例えば、逐次発生データ解析装置は、解析サーバ102、データ解析受付サーバ104、及びデータ高速解析サーバ105を実現する情報処理装置によって実現される。
In the example illustrated in FIG. 2, the sequential data analysis device is realized by, for example, the data high-
以下、図1及び図2に示した手段毎の実現方法を説明する。 Hereinafter, a method for realizing each means shown in FIGS. 1 and 2 will be described.
サービス提供手段1は、データの解析結果を、アプリケーションサーバ101を運営する事業者ユーザに提供する手段である。例えば、サービス提供手段1は、Webアクセスの動線分析等の解析結果を、ネットワークを介して、事業者ユーザの端末に配信する。以下、Webアクセスの動線分析を行う場合を例に説明する。
The service providing means 1 is a means for providing data analysis results to a business user who operates the
図3は、Webアクセスの動線分析サービスの入力画面例を示す説明図である。なお、具体的には、サービス提供手段1は、例えば、事業者ユーザの端末からの要求に応じて、図3に示す入力画面の画面情報(例えば、Webページの情報)を送信する。次いで、事業者ユーザの端末は、サービス提供手段1から受信した画面情報に基づいて、図3に示す入力画面を表示する。そして、事業者ユーザは、端末に表示された入力画面を見ながら操作を行うことによって、Webアクセスの動線分析サービスの要求操作を行う。図3に示す画面例では、Webページ毎に、「どのページからのアクセスが多いか」を示している。ただし、図3に示す画面例は一例であり、解析サービスの提供に用いる画面例は、本実施形態で示したものに限られない。
FIG. 3 is an explanatory diagram showing an example of an input screen of a web access flow line analysis service. Specifically, for example, the
図3において、URL入力フィールド(U01)は、解析対象のWebページのURLの入力部である。具体的には、解析サービスを利用する事業者ユーザがURL入力部U01にURLを入力操作すると、事業者ユーザの端末は、事業者ユーザの操作に従って、解析対象のWebページのURLを入力する。 In FIG. 3, a URL input field (U01) is a URL input part of a Web page to be analyzed. Specifically, when a business user who uses the analysis service inputs a URL to the URL input unit U01, the business user's terminal inputs the URL of the Web page to be analyzed in accordance with the business user's operation.
解析ボタン(U02)は、入力したURLで特定されるWebページの動線解析の要求操作を行うためのボタン(入力部)である。具体的には解析サービスを利用する事業者ユーザが解析ボタンU02をマウス等でクリック操作すると、事業者ユーザの端末は、入力したURLで示されるWebページの解析要求を、ネットワークを介してサービス提供手段1に送信する。
The analysis button (U02) is a button (input unit) for performing a request operation for the flow line analysis of the Web page specified by the input URL. Specifically, when a business user who uses the analysis service clicks the analysis button U02 with a mouse or the like, the business user's terminal provides a service for requesting the analysis of the Web page indicated by the input URL via the network. Send to
ランキング(U03)は、アクセスが多かった順にWebページのランキングを表示する表示領域である。また、アクセス元のURL(U04)は、どのWebページから移ってきたを表示する表示領域である。また、アクセス数(U05)は、アクセス数を表示する表示領域である。 The ranking (U03) is a display area for displaying the ranking of Web pages in the order of frequent access. Further, the URL (U04) of the access source is a display area for displaying which Web page has moved from. The access count (U05) is a display area for displaying the access count.
サービス提供手段1は、事業者ユーザの端末から、解析対象のWebページのURLの入力情報を受ける(受信する)。また、解析ボタンU02が押されると、サービス提供手段1は、解析要求を受信し、解析命令受付手段6に解析要求のクエリを発行(出力)する。以下、解析要求のクエリのフォーマットの例を示す。ただし、この解析要求のクエリのフォーマットの例は、本実施形態で示したものに限られない。
The service providing means 1 receives (receives) input information of the URL of the Web page to be analyzed from the terminal of the business user. When the analysis button U02 is pressed, the
解析要求のクエリのフォーマット:(GetReferrerRanking、URL)
例:(GetReferrerRanking、”http://bar.co.jp/~foo/Page-001”)Analysis request query format: (GetReferrerRanking, URL)
Example: (GetReferrerRanking, “http://bar.co.jp/~foo/Page-001”)
なお、”GetReferrerRanking”は、動線分析を指定するコマンド名であり、固定値である。また、コマンド名は、上記に示した例に限られない。
URLは、解析対象のデータ(Webページのデータ)を表すURLであり、URL入力フィールド(U01)からの入力値である。“GetReferrerRanking” is a command name for specifying flow line analysis, and is a fixed value. The command name is not limited to the example shown above.
The URL is a URL representing data to be analyzed (data of a Web page), and is an input value from the URL input field (U01).
上記に示した解析要求のクエリに対して、解析命令受付手段6は、以下に示すフォーマットで解析結果をサービス提供手段1に対して返答(出力又は送信)する。
In response to the analysis request query described above, the analysis
解析結果のフォーマット:((ランキング,アクセス元URL,アクセス数),(ランキング,アクセス元URL,アクセス数))
例:((1,http://bar.co.jp/~foo/Page-999,1230),(2,http://aaa.co.jp/~bbb/Page-123,881 )...)Analysis result format: ((ranking, access source URL, number of accesses), (ranking, access source URL, number of accesses))
Example: ((1, http://bar.co.jp/~foo/Page-999, 1230), (2, http://aaa.co.jp/~bbb/Page-123, 881). .)
ただし、上記に示した返答結果のフォーマットは一例であり、本実施形態で示したものに限られない。 However, the format of the response result shown above is an example, and is not limited to that shown in the present embodiment.
サービス提供手段1は、解析要求のクエリ対する回答(解析結果)を受け取ると(入力又は受信すると)、図3に示すように、ランキング(U03)や、アクセス元のURL(U04)、アクセス数(U05)のフィールドに解析結果を表示した表示画面の情報を生成する。また、サービス提供手段1は、事業者ユーザの端末に対して、ネットワークを介して、生成した表示画面の情報を送信し、事業者ユーザの端末で解析結果が表示される。
When the
サービス要件設定手段2は、事業者ユーザが提供するサービス毎に(例えば、Webページ毎に)、サービスのレスポンスタイムの要件(サービス要件)を設定し記憶する手段である。 The service requirement setting means 2 is a means for setting and storing a service response time requirement (service requirement) for each service provided by the business user (for example, for each Web page).
図4は、Webページ毎にレスポンスタイムの要件(サービス要件)を設定した場合の例を示す説明図である。図4において、URL(T02−01)は、サービス要件の設定対象のWebページのURLである。また、レスポンスタイムの要件(T02−02)は、レスポンスタイムの要件(サービス要件)の設定値である。図4に示す例では、早いレスポンスが必要であり、優先的に事前解析対象としたいデータに対しては、サービス要件としてHighが設定される。一方、レスポンスが遅くてもかまわず、それ程優先的に事前解析対象とする必要がないデータに対しては、サービス要件としてLowが設定される。 FIG. 4 is an explanatory diagram showing an example when response time requirements (service requirements) are set for each Web page. In FIG. 4, URL (T02-01) is the URL of the Web page for which service requirements are set. The response time requirement (T02-02) is a set value of the response time requirement (service requirement). In the example shown in FIG. 4, an early response is required, and High is set as a service requirement for data that is to be preliminarily analyzed. On the other hand, Low may be set as a service requirement for data that may be slow in response and does not need to be preliminarily analyzed.
解析サービスを受けるために、事業者ユーザは、事前にこのサービス要件の設定を入力操作しておく。また、サービス要件設定手段2は、事業者ユーザの端末から受信した設定指示情報に基づいて、データ毎にサービス要件を設定し予め記憶装置に記憶している。そして、サービス要件設定手段2は、事前解析制御手段8の要求に応じて、事前解析制御手段8から入力(又は受信)したURLをキーに、このURLに対応したレスポンスタイムの要件(サービス要件)の値を検索して抽出し、事前解析制御手段8に対して出力(又は送信)する。
In order to receive the analysis service, the business operator inputs the service requirement setting in advance. Further, the service requirement setting means 2 sets a service requirement for each data based on the setting instruction information received from the operator user's terminal, and stores it in the storage device in advance. Then, in response to a request from the prior
また、本実施形態では、事業者ユーザの設定操作に従ってサービス要件を設定する場合を示したが、サービス要件設定手段2は、所定のルールに従ってサービス要件を自動設定するようにしてもよい。例えば、サービス要件設定手段2は、Webアクセスの動線分析サービスを行う場合には、新サービスのプロモーション等を紹介しているサイトを検出して、事前解析の対象として自動設定するようにしてもよい。
Further, in the present embodiment, the case where the service requirement is set according to the setting operation of the operator user is shown, but the service
また、サービス要件設定手段2は、例えば、内容が変動するデータを自動的に検出して事前解析対象として自動設定するようにしてもよい。この場合、例えば、Webサイトのトップページは一般に内容が頻繁に変動している点に着目し、サービス要件設定手段2は、Webサイトのトップケージの情報に対して、事前解析対象とするようにサービス要件を自動設定するようにしてもよい。なお、サービス要件設定手段2は、Webサイトのトップページであるか否かを、例えば、URLに「index.html」等のファイル名が含まれるか否かを判断することによって判定することができる。
In addition, the service
また、例えば、交通情報提供システムに適用する場合には、サービス要件設定手段2は、国道に関係する交通情報を事前解析対象として自動設定したり、駅前に関係する交通情報を事前解析対象として自動設定したりしてもよい。 Further, for example, when applied to a traffic information providing system, the service requirement setting means 2 automatically sets traffic information related to a national road as a prior analysis target or automatically sets traffic information related to a station front as a prior analysis target. It may be set.
解析データ発生手段3は、解析対象のデータを発生させる手段である。本実施形態では、解析データ発生手段3がWebサーバによって実現され、アクセスログのデータを発生する場合を例に説明する。解析データ発生手段3は、Webサーバのアクセスログのデータとして、図5に示すように、日時(T03−01)、URL(T03−02)、及びReferrer(T03−03)ののフィールドをもつデータを発生するものとする。なお、日時(T03−01)は、Webページにアクセスがあった日時である。また、URL(T03−02)は、アクセス先のWebページのURLである。また、Referrer(T03−03)は、アクセス元のWebページのURLである。
The analysis data generation means 3 is means for generating data to be analyzed. In the present embodiment, a case where the analysis
図5に示す例では、例えば、日時「2008/12/16 10:00:00 」に、Webページ”http://bar.co.jp/~foo/Page-001”へ、Webページ”http://bar.co.jp/~foo/Page-002”から移動するアクセスがあったことが分かる。 In the example shown in FIG. 5, for example, at the date “2008/12/16 10:00:00”, the web page “http://bar.co.jp/~foo/Page-001” It can be seen that there was an access that moved from “: //bar.co.jp/~foo/Page-002”.
なお、図5に示す例では、Webページのアクセスログのデータを、CSV形式とテキストデータとで記載する場合を示したが、アクセスログのデータの形式は、本実施形態で示したものに限られない。さらに、解析データ発生手段3は、Webページのアクセスログのデータとして、図5に示した日時(T03−01)やURL(T03−02)、Referrer(T03−03)以外のフィールドをもつデータを発生してもよい。なお、本実施形態では、説明を簡単にするために、図5に示すフィールドのみをもつアクセスログのデータを説明に用いる。 In the example shown in FIG. 5, the case where the access log data of the Web page is described in the CSV format and the text data is shown. However, the access log data format is not limited to that shown in this embodiment. I can't. Further, the analysis data generating means 3 uses data having fields other than the date and time (T03-01), URL (T03-02), and Referrer (T03-03) shown in FIG. 5 as access log data of the Web page. It may occur. In this embodiment, in order to simplify the description, access log data having only the fields shown in FIG. 5 is used for the description.
解析データ発生手段3は、発生したデータを、解析データ記憶手段4に転送(出力)し、一時記憶させる。例えば、解析データ発生手段3は、以下に示すフォーマットでデータを解析データ記憶手段4に転送(出力)すればよい。
The analysis data generation means 3 transfers (outputs) the generated data to the analysis data storage means 4 for temporary storage. For example, the analysis
データのフォーマット:(日時、URL、Referrer)
例:(2008/12/16 10:00:00 、http://bar.co.jp/~foo/Page-001、http://bar.co.jp/~foo/Page-002)Data format: (Date, URL, Referrer)
Example: (2008/12/16 10:00:00, http://bar.co.jp/~foo/Page-001, http://bar.co.jp/~foo/Page-002)
ただし、上記に示したデータのフォーマットは一例であり、本実施形態で示したものに限られない。 However, the format of the data shown above is an example, and is not limited to that shown in the present embodiment.
解析データ記憶手段4は、解析データ発生手段3が発生したデータを一時記憶する手段である。解析データ記憶手段4が記憶しているデータは、解析手段5と事前解析制御手段8とによって検索され抽出される。なお、解析データ記憶手段4は、リレーショナルデータベースを用いて実現してもよい。
The analysis
解析データ記憶手段4は、少なくとも、解析データ発生手段3が発生するデータと同じフィールドを最低限もつデータを記憶する。例えば、解析データ記憶手段4は、図6に示すように、日時(T04−01)、URL(T04−02)、及びReferrer(T04−03)を含むデータを記憶する。なお、日時(T04−01)は、Webページにアクセスがあった日時である。また、URL(T04−02)は、アクセス先のWebページのURLである。また、Referrer(T04−03)は、アクセス元のWebページのURLである。
The analysis
なお、実際にシステムを運用する際には、解析データ記憶手段4から古いデータを随時削除する等の処理が必要であるが、本発明とは直接的には無関係であるので、以下、説明を分かりやすくするために、基本的に解析データ記憶手段4にデータが追加され続けるものとして説明を行う。
When actually operating the system, it is necessary to delete old data from the analysis data storage means 4 as needed. However, since it is not directly related to the present invention, the following explanation will be given. In order to make it easy to understand, it is basically assumed that data is continuously added to the analysis
解析手段5は、データを解析する手段であり、本実施形態では、解析手段5は、Webアクセスログのデータの動線分析を行う。解析手段5は、解析命令受付手段6又は事前解析制御手段8から、解析要求のクエリを受けると(入力すると)、解析対象のデータ(本例では、Webアクセスログデータ)を解析データ記憶手段7から読み込む。そして、解析手段5は、読み込んだデータにもとづいて解析処理を実行し、要求を受けた手段(解析命令受付手段6又は事前解析制御手段8)に解析結果を回答(出力)する。
The
なお、解析命令受付手段6又は事前解析制御手段8から出力される解析要求のクエリは、サービス提供手段1が解析命令受付手段6に出力するクエリと同じフォーマットのクエリを用いればよい。また、解析手段5は、解析結果の回答として、解析命令受付手段6がサービス提供手段1に出力する回答と同じ形式のデータを出力すればよい。
The query of the analysis request output from the analysis
解析手段5は、以下のような動線解析方法に従って解析処理を実行する。ただし、本実施形態で示す解析処理のアルゴリズムは一例であり、解析手段5は、他の解析方法に従って解析処理を実行してもよい。
The analysis means 5 performs an analysis process according to the following flow line analysis method. However, the analysis processing algorithm shown in the present embodiment is merely an example, and the
ステップ1:
まず、解析手段5は、解析要求のクエリで指定されたURLのデータを、解析データ記憶手段4が記憶する各データURLフィールド(T04−02)に基づいて検索し、URLが合致するデータを抽出する。
ステップ2:
次いで、解析手段5は、この抽出したデータセットに対して、Referrerの値毎に出現数をカウントする。
ステップ3:
そして、解析手段5は、出現数の多い順にデータを並び替え、データに順位をつける。Step 1:
First, the
Step 2:
Next, the analysis means 5 counts the number of appearances for each value of Referrer for the extracted data set.
Step 3:
Then, the
解析結果記憶手段7は、事前解析した結果を記憶する手段である。解析結果記憶手段7は、事前解析制御手08から事前に実行した解析処理の解析結果を受け取り(書き込まれ)、入力した事前解析結果を随時記憶する。また、解析命令受付手段6は、解析結果記憶手段7が記憶する事前解析結果を必要に応じて検索し抽出する。解析結果記憶手段7は、図7に示すように、解析結果管理テーブルと解析結果詳細テーブルとの2種類のテーブルを記憶すればよい。 The analysis result storage means 7 is a means for storing the result of prior analysis. The analysis result storage means 7 receives (writes) the analysis result of the analysis process executed in advance from the pre-analysis controller 08 and stores the input pre-analysis result as needed. Moreover, the analysis command reception means 6 searches and extracts the prior analysis results stored in the analysis result storage means 7 as necessary. The analysis result storage means 7 may store two types of tables, that is, an analysis result management table and an analysis result detail table, as shown in FIG.
解析結果管理テーブルは、解析したデータのURLとそのデータの事前解析結果との対応関係を含むテーブルである。図7に示すように、解析結果記憶手段7は、1つの解析結果管理テーブルを記憶する。また、解析結果記憶手段7は、URL(T07−01)及び解析結果(T07−02)のフィールドを含む解析結果管理テーブルを記憶する。なお、URL(T07−01)は、解析対象のデータのURLを含むフィールドである。また、解析結果(T07−02)は、事前解析結果へのリンクを示す情報を含むフィールドである。 The analysis result management table is a table including a correspondence relationship between the URL of the analyzed data and the pre-analysis result of the data. As shown in FIG. 7, the analysis result storage means 7 stores one analysis result management table. The analysis result storage means 7 stores an analysis result management table including URL (T07-01) and analysis result (T07-02) fields. Note that URL (T07-01) is a field including the URL of data to be analyzed. The analysis result (T07-02) is a field including information indicating a link to the pre-analysis result.
解析結果詳細テーブルは、解析結果管理テーブルでリンクされた解析結果の詳細な解析内容を示すテーブルである。解析結果詳細テーブルに含まれる各解析内容の情報は、解析結果管理テーブルの解析結果からリンクされている。また、図7に示すように、解析結果記憶手段7は、ランキング(T07−03)、アクセス元のURL(T07−04)、及びアクセス数(T07−05)のフィールドを含む解析結果詳細テーブルを記憶する。なお、ランキング(T07−03)は、アクセスが多かった順のランキングを示す情報を含むフィールドである。また、アクセス元のURL(T07−04)は、どのWebページから移ってきたかを示す情報(具体的には、アクセス元のWebページのURL)を含むフィールドである。また、アクセス(T07−05)は、アクセス数のカウント値を示す情報を含むフィールドである。 The analysis result detail table is a table showing detailed analysis contents of the analysis results linked in the analysis result management table. Information of each analysis content included in the analysis result detail table is linked from the analysis result of the analysis result management table. Further, as shown in FIG. 7, the analysis result storage means 7 has an analysis result detailed table including fields of ranking (T07-03), URL of access source (T07-04), and number of accesses (T07-05). Remember. The ranking (T07-03) is a field including information indicating the ranking in the order of the most accesses. The access source URL (T07-04) is a field including information (specifically, the URL of the access source web page) indicating from which web page it has moved. Access (T07-05) is a field including information indicating the count value of the number of accesses.
事前解析制御手段8は、事前解析処理の制御を行うメイン制御部である。事前解析制御手段8は、以下に示す要件に従って、いずれのURLのデータを事前解析すべきか判断する。例えば、事前解析制御手段8は、サービス要件設定手段2によってURL毎に設定されたサービス要件に従って、そのURLのデータを事前解析すべきか否かを判断する。また、例えば、事前解析制御手段8は、解析データの変化を検出して、データを事前解析すべきか否かを判断する。そして、事前解析制御手段8は、事前解析対象であると判断したデータを解析手段5に事前解析させる。
The
図8は、事前解析制御手段8のより詳細な構成例を示すブロック図である。図8に示すように、事前解析制御手段8は、解析対象監視手段801、事前解析対象生成手段802、事前解析依頼手段803、及び事前解析結果登録手段804を含む。
FIG. 8 is a block diagram showing a more detailed configuration example of the prior analysis control means 8. As shown in FIG. 8, the
解析対象監視手段801は、解析データ記憶手段4に記憶されているデータの追加状況を監視する機能を備える。また、事前解析対象生成手段802は、解析対象監視手段801の監視結果と、サービス要件設定手段2が記憶しているサービス要件の情報とに基づいて、優先的に事前解析すべきデータの一覧情報を作成する機能を備える。また、事前解析依頼手段803は、事前解析対象生成手段802が生成した事前解析対象の一覧情報に示されるデータの事前解析を、解析手段5に依頼する機能を備える。また、事前解析結果登録手段804は、解析手段5が事前解析処理を行った解析結果を解析結果記憶手段7に記憶させる機能を備える。
The analysis
解析対象監視手段801は、定期的に(例えば、5分単位に)、解析データ記憶手段4が記憶する情報を監視する処理を繰り返し実行する。解析対象監視手段801は、解析データ記憶手段4が記憶しているデータのうち、前回の監視処理を実行した後に追加されたデータが存在するか否かを検出する。解析対象監視手段801は、追加データを検出する場合、例えば、監視処理を毎回実行する度に、追加されたデータの中で最も日時が新しい日時の値を記憶しておく。そして、解析対象監視手段801は、次回の監視処理を実行する時に、この記憶する日時よりも新しい日時のデータを新たに追加されたデータと判断すればよい。ただし、この検出方法は一例であり、解析データ記憶手段4が記憶する情報に検出用のフィールドを追加し、解析対象監視手段801は、既に処理済みのフィールドには処理済みの情報を書き込む等の処理を行うことによって、データの追加を検出できるようにしてもよい。
The analysis
事前解析対象生成手段802は、解析対象監視手段801が検出した追加データに含まれるURLの集合を抽出する。具体的には、事前解析対象生成手段802は、抽出した各追加データのURLのうち、重複するURLを除くようにすればよく、全ての追加されたデータのURLを順にハッシュテーブルに登録する。そして、このハッシュテーブルのキーの一覧が事前解析対象の候補となるデータのURLの集合になる。以下、このハッシュテーブルに含まれるURLの集合を、追加URLという。
The pre-analysis
また、事前解析対象生成手段802は、追加URLそれぞれに対応するサービス要件を、サービス要件設定手段2から得る(入力する)。そして、事前解析対象生成手段802は、追加URLの中から、対応するサービス要件の値がHighであるものを、事前解析を実行する対象として特定する。一方、もし、サービス要件の値がHighであるものがなければ、事前解析対象生成手段802は、サービス要件の値がLowのものを事前解析の対象として特定する。そのようにすることによって、高速処理が要件となっているURLのデータを優先的に事前解析対象とすることができる。なお、本実施形態では、説明を簡単にするために、サービス要件をHighとLowとの2段階に設定する場合を示したが、より細かく段階分けして(例えば、3段階以上に設定するようにして)、この事前解析対象とするか否かの判定処理をより複数段階に行ってもよい。
Also, the pre-analysis
事前解析依頼手段803は、事前解析対象生成手段802によって特定された事前解析の対象となるデータについて、解析手段5に対して解析依頼を出力する。事前解析依頼手段803は、例えば、以下に示すフォーマットの解析依頼を出力するようにすればよい。
The
フォーマット:(Analyze <{URLの集合})
例:(Analyze ,{”http://bar.co.jp/~foo/Page-999”,”http://hml.co.jp/~xyz/Page-777”})Format: (Analyze <{set of URLs})
Example: (Analyze, {"http://bar.co.jp/~foo/Page-999","http://hml.co.jp/~xyz/Page-777"})
なお、上記に示す例において、Analyze は、コマンド名である。なお、事前解析依頼手段803が出力する解析依頼のフォーマット例は、本実施形態で示したものに限られない。
In the example shown above, Analyze is a command name. Note that the format example of the analysis request output by the prior
解析手段5は、上記のコマンドを含む解析要求を受け取る(入力する)と、解析要求にパラメータとして含まれるURLのデータを順に解析し、事前解析依頼手段803に解析結果を回答(出力)する。この場合、解析手段5は、例えば、以下に示す回答フォーマットの解析結果を出力する。
When the
解析結果のフォーマット:{解析結果の集合}
解析結果:(解析対象のURL,{動線情報の集合})Analysis result format: {Analysis result set}
Analysis result: (URL to be analyzed, {collection of flow line information})
ここで、動線情報とは、(ランキング、アクセス元のURL、アクセス数)である。以下、上記のフォーマットで出力される解析結果の例を示す。 Here, the flow line information is (ranking, URL of access source, number of accesses). An example of the analysis result output in the above format is shown below.
例:{
(http://bar.co.jp/~foo/Page-001,{(1,http://bar.co.jp/~foo/Page-999,1230),
(2,http://aaa.co.jp/~bbb/Page-123,881 ),(3,...)}),
(http://bar.co.jp/~foo/Page-002,{(1,http://bar.co.jp/~foo/Page-111,1357),
(2,http://aaa.co.jp/~bbb/Page-654,881 ),(3,...)}),...
}Example: {
(Http://bar.co.jp/~foo/Page-001, {(1, http: //bar.co.jp/~foo/Page-999, 1230),
(2, http://aaa.co.jp/~bbb/Page-123,881), (3, ...)}),
(Http://bar.co.jp/~foo/Page-002, {(1, http: //bar.co.jp/~foo/Page-111, 1357),
(2, http://aaa.co.jp/~bbb/Page-654,881), (3, ...)}),. . .
}
事前解析結果登録手段804は、以下に示す方法で、解析結果記憶手段7に事前解析結果を登録する。まず、事前解析結果登録手段804は、新たな事前解析結果が、解析結果記憶手段7に既に登録されているか否かを検索して判定する。具体的には、事前解析結果登録手段804は、検索対象の事前解析結果のデータのURLをキーとして、解析結果記憶手段7が記憶する解析結果管理テーブルに含まれるURLフィールド(T06−01)を検索する。そして、事前解析結果登録手段804は、合致するURLが見つかれば既に登録済みであると判定し、見つからなければ未登録であると判断できる。
The pre-analysis
事前解析結果登録手段804は、登録済みであると判定した場合には、その登録済みのレコードに新たな事前解析結果を上書きする。すなわち、事前解析結果登録手段804は、解析結果フィールドのリンク先の解析結果詳細テーブルのレコードを新たな動線情報で上書きする。
If the pre-analysis
また、事前解析結果登録手段804は、未登録あると判定した場合には、解析結果管理テーブルに新たなレコードを追加し、その追加したレコードに事前解析結果を登録する。すなわち、事前解析結果登録手段804は、解析結果管理テーブルに新たなレコードを追加し、この解析結果管理テーブルの新たなレコードのURLフィールドに解析対象のデータのURLを登録する。また、事前解析結果登録手段804は、新たなレコードの解析結果のフィールドには、新たな解析結果詳細テーブルを追加して、この追加した解析結果詳細テーブルへのリンク情報を登録する。さらに、事前解析結果登録手段804は、新たに追加した解析結果詳細テーブルには、新たな事前解析結果である動線情報を登録する。
If it is determined that there is no registration, the pre-analysis
解析命令受付手段6は、サービス提供手段1から受け取った(入力した)解析要求のクエリに対して、解析結果を高速に回答するために、解析要求のクエリの処理を分岐する手段である。解析命令受付手段6は、サービス提供手段1からの解析要求のクエリに対して、事前解析結果を利用可能であると判断した場合には、事前解析結果記憶手段7から事前解析結果をロードして、その事前解析結果をサービス提供手段1に対して出力(又は送信)する。そのようにすることによって、高速に解析要求のクエリに対する回答を行うことができる。また、解析命令受付手段6は、事前解析結果を利用できないと判断した場合には、解析手段5に解析要求のクエリを転送して、通常通りの時間をかけた解析処理を行って、その解析結果をサービス提供手段1に対して回答(出力又は送信)する。なお、解析処理の分岐方法については後述する。
The analysis command receiving means 6 is a means for branching the processing of the analysis request query in order to reply the analysis result at high speed to the analysis request query received (input) from the
なお、本実施形態において、逐次発生データ解析システムを実現する情報処理装置の記憶装置は、逐次発生データを高速に解析するための各種プログラムを記憶している。例えば、逐次発生データ解析システムを実現する情報処理装置の記憶装置は、コンピュータに、解析要求よりも前に、逐次発生するデータである逐次発生データを事前に解析する処理を実行させる制御を行う事前解析制御処理を実行させるための逐次発生データ解析プログラムを記憶している。 In the present embodiment, the storage device of the information processing apparatus that implements the sequential generation data analysis system stores various programs for analyzing sequential generation data at high speed. For example, a storage device of an information processing apparatus that realizes a sequential generation data analysis system performs a control in advance that causes a computer to execute a process of analyzing sequential generation data that is sequentially generated before an analysis request. A sequential generation data analysis program for executing analysis control processing is stored.
次に、動作について説明する。図9は、逐次発生データ解析システムが逐次発生データの解析を行う処理の一例を示す流れ図である。図9に示すように、本実施形態では、サーバが出力するログデータやセンサが出力するデータ等、逐次的に発生するデータを収集して解析することにより、様々なサービスをユーザに提供する装置(システム)に関して、以下の処理を実行する。 Next, the operation will be described. FIG. 9 is a flowchart illustrating an example of processing in which the sequential generation data analysis system analyzes sequential generation data. As shown in FIG. 9, in the present embodiment, an apparatus that provides various services to a user by collecting and analyzing sequentially generated data such as log data output by a server and data output by a sensor. The following processing is executed for (system).
図9に示すように、逐次発生データ解析システムの動作ステップは、解析対象のデータが逐次発生する解析対象データ発生ステップ(ステップS1)を含む。また、解析対象データ発生ステップS1で蓄積した解析対象データを解析する解析ステップ(ステップS2)を含む。また、事業者ユーザの操作に従って入力されたデータ解析依頼の要求に従い、解析を開始し事業者ユーザに対して解析結果を提供する解析サービス利用ステップ(ステップS3)を含む。また、解析サービス利用ステップS3における具体的な解析の依頼を受ける前に、事前に解析を実行する事前解析ステップ(ステップS4)を含む。また、解析サービス利用ステップS3における解析の依頼を受けたときに、既に事前解析ステップS4で解析済みのデータである場合には、この事前解析結果を回答として出力し、まだ事前解析が行われていないデータである場合には、解析ステップS2の処理を実行するように解析を依頼し、この解析結果を回答として出力する解析サービス制御ステップS5を含む。 As shown in FIG. 9, the operation step of the sequential generation data analysis system includes an analysis target data generation step (step S1) in which the analysis target data is sequentially generated. Also included is an analysis step (step S2) for analyzing the analysis target data accumulated in the analysis target data generation step S1. Also included is an analysis service utilization step (step S3) for starting the analysis and providing the analysis result to the business user in accordance with the request for the data analysis request input according to the business user's operation. In addition, a pre-analysis step (step S4) for executing an analysis in advance before receiving a specific analysis request in the analysis service utilization step S3 is included. If the data is already analyzed in the pre-analysis step S4 when the analysis request is received in the analysis service utilization step S3, the pre-analysis result is output as an answer, and the pre-analysis is still performed. If there is no data, it includes an analysis service control step S5 that requests the analysis to execute the process of the analysis step S2 and outputs the analysis result as an answer.
なお、実際には、解析データ発生手段3は、データを逐次的に随時発生して出力している。そのため、実際には、逐次発生データ解析システムは、図9に示す各ステップS1〜S5の処理を並列的に実行しており、適宜通信しあいながら処理を進める。以下、まず、各ステップで実行される処理について説明する。 Actually, the analysis data generating means 3 generates and outputs data sequentially at any time. Therefore, in practice, the sequential generation data analysis system executes the processes of steps S1 to S5 shown in FIG. 9 in parallel, and proceeds with the processes while communicating appropriately. Hereinafter, first, processing executed in each step will be described.
解析対象データ発生ステップ(ステップS1)では、解析データ発生手段3は、アプリケーションやサーバ等を利用する際に、解析対象のデータを発生させるアプリケーション利用ステップ(ステップS101)の処理と、アプリケーション利用ステップS101の処理で発生した解析対象のデータを解析データ記憶手段4に蓄積させる解析データ記憶ステップ(ステップS102)の処理とを実行する。 In the analysis target data generation step (step S1), the analysis data generation means 3 performs processing of an application use step (step S101) for generating data to be analyzed when using an application, a server, etc., and an application use step S101. The analysis data storage step (step S102) for accumulating the analysis target data generated in the process in the analysis data storage means 4 is executed.
解析サービス利用ステップ(ステップS3)では、サービス要件設定手段2は、事業者ユーザの設定操作に従って、解析サービスを受ける前に、解析サービス毎に、解析のレスポンスタイム等の解析の要件(サービス要件)を設定する解析サービス要件設定ステップ(ステップS301)の処理を実行する。また、サービス提供手段1は、事業者ユーザの要求操作に従って、解析サービスの要求を受け付け(入力して)解析命令受付手段6に対して要求する解析サービス要求ステップ(ステップS302)の処理と、解析命令受付手段6から解析結果を受け取り(入力して)、事業者ユーザに対して解析結果を提供する解析サービス提供ステップ(ステップS303)の処理とを実行する。
In the analysis service utilization step (step S3), the service requirement setting means 2 performs analysis requirements such as response time of analysis (service requirements) for each analysis service before receiving the analysis service according to the setting operation of the operator user. The processing of the analysis service requirement setting step (step S301) is set. Further, the
解析サービス制御ステップ(ステップS5)では、解析命令受付手段6は、サービス提供手段1から解析依頼を受け付ける(入力する)解析命令受付ステップ(ステップS501)の処理を実行する。また、解析命令受付手段6は、この命令(解析依頼)で解析を要求されているデータが既に事前解析され解析済みであるか否かを調査する事前解析利用可能性チェックステップ(ステップS502)の処理を実行する。また、解析命令受付手段6は、事前解析結果を利用可能であると判定した場合に、その事前解析結果を解析結果記憶手段7から得る(抽出する)事前解析結果利用ステップ(ステップS503)の処理を実行する。また、解析命令受付手段6は、事前解析結果を利用不可能であると判定した場合に、解析手段5に対して解析処理の実行を依頼する解析依頼ステップ(ステップS0504)の処理を実行する。また、解析命令受付手段6は、事前解析結果利用ステップ(ステップS503)又は解析結果依頼ステップ(ステップS504)で得た解析結果を、サービス提供手段1に対して回答(出力)する解析命令回答ステップ(ステップS505)の処理を実行する。
In the analysis service control step (step S5), the analysis command receiving means 6 executes the processing of the analysis command receiving step (step S501) that receives (inputs) an analysis request from the
また、図10は、事前解析ステップ(ステップS4)における事前解析処理の一例を示す流れ図である。図10に示すように、事前解析ステップ(ステップS4)では、事前解析制御手段8は、解析サービス利用ステップ(ステップS3)において事業者ユーザの入力操作に従って設定された解析の要件(サービス要件)を読み込む解析サービス要件読込ステップ(ステップS401)の処理を実行する。また、事前解析制御手段8は、解析対象データ発生ステップ(ステップS1)で蓄積した解析データに関して、前回の監視処理を実行した後に追加されたデータを検出する解析対象変化検出ステップ(ステップS402)の処理を実行する。 FIG. 10 is a flowchart showing an example of the pre-analysis process in the pre-analysis step (step S4). As shown in FIG. 10, in the pre-analysis step (step S4), the pre-analysis control means 8 sets the analysis requirements (service requirements) set according to the operator user input operation in the analysis service utilization step (step S3). The analysis service requirement reading step (step S401) to be read is executed. Further, the prior analysis control means 8 performs an analysis target change detection step (step S402) for detecting data added after the previous monitoring process is performed on the analysis data accumulated in the analysis target data generation step (step S1). Execute the process.
また、事前解析制御手段8は、解析対象変化検出ステップ(ステップS402)で検出した追加データの中から、解析サービス要件読込ステップ(ステップS401)で読み込んだサービス要件を満たすか否かを判断することによって、事前解析を行うデータを選別する事前解析対象決定ステップ(ステップS403)の処理を実行する。また、事前解析制御手段8は、事前解析決定ステップ(ステップS403)で選別した事前解析データについて、解析手段5に対して解析処理の実行を依頼する事前解析依頼ステップ(ステップS404)の処理を実行する。また、事前解析制御手段8は、事前解析依頼ステップ(ステップS404)で解析手段5から得られた回答を事前解析結果として解析結果記憶手段7に記憶させる事前解析結果登録ステップ(ステップS405)の処理を実行する。
Further, the prior analysis control means 8 determines whether or not the service requirement read in the analysis service requirement reading step (step S401) is satisfied from the additional data detected in the analysis target change detection step (step S402). Thus, the pre-analysis target determining step (step S403) for selecting data to be pre-analyzed is executed. Further, the
また、事前解析制御手段8は、解析命令受付手段6からの事前解析データの抽出要求に対して、解析結果記憶手段7に記憶している事前解析結果を抽出して回答(出力)する事前解析結果回答ステップ(ステップS406)の処理を実行する。
The
なお、データは逐次的に随時発生しているのであり、解析要求も随時発生するものであることから、事前解析制御手段8は、解析サービス要件読込ステップ(ステップS401)から事前解析結果登録ステップ(ステップS405)までの処理を、事前解析結果回答ステップ(ステップS406)の処理とは独立に一定間隔で繰り返し実行している。 Since the data is sequentially generated at any time and the analysis request is also generated at any time, the pre-analysis control means 8 performs the pre-analysis result registration step (step S401) to the pre-analysis result registration step (step S401). The processing up to step S405) is repeatedly executed at regular intervals independently of the processing in the preliminary analysis result answering step (step S406).
また、事前解析制御手段8は、事前解析結果回答ステップ(ステップS406)の処理を、解析命令受付手段6から要求があったタイミングで起動して実行し、処理が終了すると要求待ち状態に戻るように制御する。
The
また、事前解析制御手段8は、解析サービス要件読込ステップ(ステップS401)から事前解析結果登録ステップ(ステップS405)までの処理と、事前解析結果回答ステップ(ステップS406)の処理とを、事前解析結果登録ステップ(ステップS405)の処理で登録した事前解析結果のデータを共有することによって、非同期にコミュニケーションをとるように実行する。 Further, the pre-analysis control means 8 performs the process from the analysis service requirement reading step (step S401) to the pre-analysis result registration step (step S405) and the process of the pre-analysis result answering step (step S406). By sharing the data of the pre-analysis result registered in the process of the registration step (step S405), it executes so as to communicate asynchronously.
以下、上記に示した各ステップの処理の実現方法を、各手段と対応させながら説明する。 Hereinafter, a method for realizing the processing of each step described above will be described in correspondence with each means.
本実施形態では、例えば、解析対象データ発生ステップ(ステップS1)の処理を、アプリケーションサーバ101が動作することによって実行する。具体的には、アプリケーション利用ステップ(ステップS101)の処理は、解析データ発生手段3によって実行される。また、解析データ記憶ステップ(ステップS102)の処理は、解析データ発生手段3によって逐次発生データを解析データ記憶手段4に記憶させることによって実行される。
In the present embodiment, for example, the processing of the analysis target data generation step (step S1) is executed by the
また、本実施形態では、例えば、解析サービス利用ステップ(ステップS3)の処理を、データ解析サービスサーバ103が動作することによって実行する。具体的には、解析サービス要件設定ステップ(ステップS301)の処理は、サービス要件設定手段2によって実行される。また、解析サービス要求ステップ(ステップS302)及び解析サービス提供ステップ(ステップS303)の処理は、サービス提供手段1によって実行される。
In this embodiment, for example, the processing of the analysis service utilization step (step S3) is executed by the operation of the data
また、本実施形態では、例えば、解析ステップ(ステップS2)の処理は、解析サーバ102の解析手段5によって実行される。
In the present embodiment, for example, the analysis step (step S2) is executed by the
また、本実施形態では、例えば、解析サービス制御ステップ(ステップS5)の処理は、データ解析受付サーバ104の解析命令受付手段6によって実行される。 In the present embodiment, for example, the processing of the analysis service control step (step S5) is executed by the analysis command receiving means 6 of the data analysis receiving server 104.
図11は、解析命令受付手段6が実行する解析命令(解析要求)の受付処理の一例を示す流れ図である。
FIG. 11 is a flowchart showing an example of an analysis command (analysis request) reception process executed by the analysis
まず、解析命令受付手段6は、解析要求のクエリを、サービス提供手段1から受け取る(入力する)処理を行う(受付ステップS501)。なお、解析命令受付手段6は、前述したようなコマンドGetReferrerRankingを含むクエリを入力するものとし、そのクエリにはパラメータとして解析対象のデータのURLが含まれているものとする。以下、このクエリに含まれるURLを解析対象URLという。
First, the analysis
次いで、解析命令受付手段6は、解析対象URLで特定されるデータについて、事前解析結果が利用できるか否かを判断するために、解析結果記憶手段7が記憶するデータを検索する(事前解析利用可能性チェックステップS502)。この場合、解析命令受付手段6は、例えば、解析結果記憶手段7が記憶する解析結果管理テーブルのURLフィールド(T07−01)の各URLの中に、解析対象URLに合致するものがあるか否かを検索する。
Next, the analysis
検索に成功した場合(合致するURLが存在した場合)には、解析命令受付手段6は、解析結果記憶手段7が記憶する解析結果管理テーブルから、URLが合致した1つのレコードを検索結果として抽出する。検索に失敗した場合(合致するURLが存在しなかった場合)には、解析命令受付手段6は、検索に失敗こと(利用可能な事前解析結果が存在しないこと)を示す値(例えばNULL)を返す(検索結果として求める)。
If the search is successful (when there is a matching URL), the analysis command receiving means 6 extracts one record that matches the URL from the analysis result management table stored in the analysis result storage means 7 as the search result. To do. When the search fails (when there is no matching URL), the analysis
次いで、もし、検索結果があれば(すなわち、ステップS502において、検索結果としてレコードを抽出した場合には)、解析命令受付手段6は、事前解析結果を利用できると判定して、事前解析結果利用ステップ(ステップS504)の処理に進む。検索結果がなければ(すなわち、ステップS502において、NULLの値を求めた場合には)、解析命令受付手段6は、事前解析結果を利用できないと判定して、ステップ(ステップS505)の処理に進む(分岐ステップS503)。 Next, if there is a search result (that is, if a record is extracted as the search result in step S502), the analysis command receiving means 6 determines that the pre-analysis result can be used, and uses the pre-analysis result. The process proceeds to step (step S504). If there is no search result (that is, if a NULL value is obtained in step S502), the analysis command receiving means 6 determines that the pre-analysis result cannot be used, and proceeds to the processing of step (step S505). (Branch step S503).
事前解析結果利用ステップS504では、解析命令受付手段6は、検索結果のレコードの解析結果フィールドに示されるリンク先の解析結果詳細テーブルを解析結果記憶手段7から抽出する。そして、解析命令受付手段6は、この抽出した解析結果詳細テーブルを、解析要求のクエリに対する回答(事前解析結果)として求める。 In the pre-analysis result utilization step S504, the analysis instruction receiving means 6 extracts from the analysis result storage means 7 the analysis result detailed table of the link destination indicated in the analysis result field of the search result record. Then, the analysis command receiving means 6 obtains the extracted analysis result detail table as an answer (preliminary analysis result) to the analysis request query.
解析依頼ステップステップS505では、解析命令受付手段6は、解析要求のクエリで指定されたデータの解析処理を実行するために、解析手段5に、その解析要求のクエリを転送する。この場合、例えば、解析命令受付手段6は、サービス提供手段1からの解析要求のクエリをそのまま解析手段5に転送すればよい。そして、解析命令受付手段6は、解析手段5から解析結果を受け取る(入力する)まで処理を待機する。
In the analysis request step step S505, the analysis instruction receiving means 6 transfers the analysis request query to the analysis means 5 in order to execute the analysis processing of the data designated by the analysis request query. In this case, for example, the analysis command receiving means 6 may transfer the analysis request query from the service providing means 1 to the analysis means 5 as it is. Then, the analysis
次いで、解析命令受付手段6は、解析結果として、解析結果記憶手段7が記憶する解析結果詳細テーブルと同じ形式の情報を解析手段5から得る(入力する)。そして、解析命令受付手段6は、この解析手段5から入力した解析結果を、解析要求のクエリに対する回答(解析結果)として求める。
Next, the analysis command receiving means 6 obtains (inputs) information in the same format as the analysis result detailed table stored in the analysis result storage means 7 from the analysis means 5 as an analysis result. Then, the analysis
次いで、解析命令受付手段6は、ステップS504で求めた事前解析結果、又はステップS505で求めた解析結果を、サービス提供手段1に対して回答(出力)する(解析命令回答ステップS506)。
Next, the analysis
また、本実施形態では、例えば、事前解析ステップ(ステップS4)の処理は、データ高速解析サーバ105によって実行される。具体的には、解析サービス要件読込ステップ(ステップS401)の処理は、事前解析対象生成手段802によって実行され、事前解析対象生成手段802は、サービス要件設定手段2からデータ(サービス要件)を読み込む。また、解析対象変化検知ステップ(ステップS402)の処理は、解析対象監視手段801によって実行される。また、事前解析対象決定ステップ(ステップS403)の処理は、事前解析対象生成手段802によって実行される。また、事前解析依頼ステップ(ステップS404)の処理は、事前解析依頼手段803によって実行される。また、事前解析結果登録ステップ(ステップS405)の処理は、事前解析結果登録手段804によって実行される。また、事前解析結果回答ステップ(ステップS406)の処理は、解析命令受付手段6によって実行される。
In the present embodiment, for example, the processing of the preliminary analysis step (step S4) is executed by the data high-
以上のように、本実施形態によれば、事前解析制御手段8により、事業者ユーザからデータ解析のサービスを要求される前に、事前に解析を実行しておく。そして、実際にデータ解析の要求があった場合に、この事前解析結果を用いて解析サービスを事業者ユーザに対して提供する。そのようにすることによって、事業者ユーザが解析要求の操作を行ってから解析結果を得られるまでの時間を大きく短縮することができ、高速な解析サービスの提供の処理を可能とすることができる。従って、逐次的に発生するデータを収集して解析する場合であっても、サービス毎のレスポンスタイムの要望に応じた解析を行うことができる。
As described above, according to the present embodiment, the prior
なお、本実施形態では、データ毎に(例えば、WebページのURL毎に)、サービス要件を設定し、事前解析対象とするか否かを設定する場合を示しているが、サービス要件の設定の仕方は、本実施形態で示したものに限られない。例えば、複数種類の解析処理を実行可能である場合に、解析処理の種類毎にサービス要件を設定し、事前解析対象とするか否かを設定するようにしてもよい。以下、解析処理の種類毎にサービス要件を設定する場合の変形例について説明する。 In the present embodiment, a case is shown in which service requirements are set for each data (for example, for each URL of a Web page) and whether or not to be subject to prior analysis is set. The manner is not limited to that shown in the present embodiment. For example, when a plurality of types of analysis processing can be executed, a service requirement may be set for each type of analysis processing, and whether or not to make a pre-analysis target may be set. Hereinafter, a modified example in the case where service requirements are set for each type of analysis processing will be described.
解析処理の種類(解析方法)毎にサービス要件を設定する場合、解析対象のデータ毎に解析方法が異なる場合でも動作するように、逐次発生データ解析システムは、図1に示した各手段の機能を拡張した以下の構成要素を含む。 When setting service requirements for each type of analysis processing (analysis method), the sequential data analysis system functions as shown in FIG. 1 so that it operates even when the analysis method differs for each data to be analyzed. It includes the following components that are expanded.
サービス提供手段1は、解析対象のデータとその解析方法とを入力する機能を備える。また、サービス要件設定手段2は、解析対象のデータと解析方法との組に対して、レスポンスタイムの要件(サービス要件)を設定する機能を備える。
The
また、解析手段5は、複数種類の解析を受け付け、複数種類の解析処理を実行する機能を備える。また、事前解析制御手段8は、サービス要件設定手段2が設定した設定情報に基づいて、事前に解析すべき対象データと、事前に解析すべき対象とする解析方法とを決定する機能を備える。また、事前解析制御手段8は、解析手段5に対して解析対象と解析方法とを指定して事前解析処理を指示する機能を備える。また、解析結果記憶手段7は、事前解析結果として、解析対象と解析方法との組に対して、事前解析処理を行った事前解析結果を記憶する。
The
また、解析命令受付手段6は、解析対象と解析方法との組に対して、解析結果記憶手段7に記憶している事前解析結果を利用するか、解析手段5に新たに解析処理を実行させるかを判断する機能を備える。
Further, the analysis
具体的には、サービス提供手段1は、例えば、図3に示した入力画面の解析ボタンU02を解析処理の種類を選択可能に構成し、事業者ユーザの操作に従って、解析処理の種類(解析方法)を入力可能にすればよい。例えば、サービス提供手段1は、プルダウンメニューで解析方法の一覧を表示するようにすればよい。
Specifically, for example, the
また、サービス要件設定手段2は、例えば、図4に示すサービス要件の設定テーブルにおいて、解析方法の設定内容を含むフィールドT02−03を追加したテーブルを用いて、サービス要件を設定し記憶するようにすればよい。なお、サービス提供手段1とサービス要件設定手段2とは、例えば、解析方法を解析名で指定して処理を行ってもよいし、内部的に解析方法を特定可能なID(解析ID)を指定して管理し処理を実行してもよい。
Further, the service requirement setting means 2 sets and stores the service requirement using a table to which a field T02-03 including setting contents of the analysis method is added in the service requirement setting table shown in FIG. 4, for example. do it. For example, the
また、解析手段5は、複数種類の解析方法で解析処理を実行可能である。この場合、例えば、解析命令受付手段6や事前解析制御手段8は、パラメータとして、解析対象のURLに加えて、解析名又は解析IDを含む解析依頼を、解析手段5に対して出力するようにすればよい。そして、解析手段5は、入力した解析依頼に含まれる解析名又は解析IDに従って、指定された種類の解析処理を実行するようにすればよい。 Moreover, the analysis means 5 can execute an analysis process by a plurality of types of analysis methods. In this case, for example, the analysis command receiving means 6 and the prior analysis control means 8 output an analysis request including an analysis name or an analysis ID as a parameter to the analysis means 5 in addition to the URL to be analyzed. do it. Then, the analysis means 5 may execute the specified type of analysis processing according to the analysis name or analysis ID included in the input analysis request.
また、事前解析制御手段8は、解析対象のURLのみに基づいて事前解析対象のデータを判断するのではなく、解析対象のURLと解析方法との組に基づいて、事前解析対象のデータ及び解析方法を判断し、事前解析処理の制御を行うようにすればよい。例えば、事前解析制御手段8は、サービス要件設定手段2が設定したサービス要件を検索する場合において、URLのフィールドT02−01と解析方法のフィールドT02ー03との組を検索キーとして、事前解析対象のデータ及び解析方法を検索するようにすればよい。また、事前解析制御手段8は、解析手段5に対して事前解析処理の実行を依頼する場合に、解析対象のデータのURLに加えて、解析方法もパラメータとして含む解析依頼を出力するようにすればよい。
Further, the
また、解析結果記憶手段7は、例えば、図7に示した解析結果管理テーブルにおいて、解析方法を含むフィールドT07−03を追加したテーブルを記憶するようにすればよい。 Further, the analysis result storage means 7 may store a table in which a field T07-03 including an analysis method is added to the analysis result management table shown in FIG.
また、解析命令受付手段6は、サービス提供手段1から、解析対象のURLと解析方法とを指定する情報を受け取る(入力する)。そして、解析命令受付手段6は、入力した解析対象のURLと解析方法との組に基づいて、事前解析結果を利用可能であるか否かをチェック(判断)する。この場合、例えば、解析命令受付手段6は、入力した解析対象のURLと解析方法との組を検索キーとして、解析結果記憶手段7が記憶する解析結果管理テーブルのURLフィールドT07−01と解析方法フィールドT07−03とを検索するようにすればよい。また、解析命令受付手段6は、解析手段5に解析処理の実行を依頼する際には、解析対象のデータのURLに加えて、解析方法もパラメータとして指定した解析依頼を出力するようにすればよい。
Further, the analysis
以上のように構成することによって、解析対象のデータ毎に解析方法が異なる場合であっても、事前解析を行うことができ、高速な解析サービスの提供の処理を可能とすることができる。 With the configuration as described above, even when the analysis method differs for each data to be analyzed, it is possible to perform a prior analysis and to enable a process for providing a high-speed analysis service.
実施形態2.
次に、本発明の第2の実施形態を図面を参照して説明する。図12は、第2の実施形態における逐次発生データ解析システムの構成の一例を示すブロック図である。また、図13は、第2の実施形態における事前解析制御手段8のより詳細な構成例を示すブロック図である。
Next, a second embodiment of the present invention will be described with reference to the drawings. FIG. 12 is a block diagram illustrating an example of the configuration of the sequential generation data analysis system according to the second embodiment. FIG. 13 is a block diagram showing a more detailed configuration example of the preliminary
図12に示すように、本実施形態では、逐次発生データ解析システムが、図1に示した構成要素に加えて、解析命令履歴手段9を含む点で、第1の実施形態と異なる。 As shown in FIG. 12, this embodiment is different from the first embodiment in that the sequential data analysis system includes an analysis command history means 9 in addition to the components shown in FIG.
解析命令履歴手段9は、具体的には、情報処理装置が備えるメモリや磁気ディスク装置、光ディスク装置等の記憶装置によって実現される。解析命令履歴手段9は、解析命令受付手段6で受け付けた解析要求のクエリの履歴を示す解析命令履歴情報を記憶する。
Specifically, the analysis
また、図13に示すように、本実施形態では、事前解析制御手段8が、図8に示した構成要素に加えて、優先事前解析判定手段805を含む点で、第1の実施形態と異なる。 As shown in FIG. 13, the present embodiment is different from the first embodiment in that the prior analysis control means 8 includes a priority preliminary analysis determination means 805 in addition to the components shown in FIG. .
優先事前解析判定手段805は、解析命令履歴手段9が記憶する解析命令履歴情報のうち多く出現する命令ほど優先的に事前解析するように、解析履歴数をカウントし、優先度を判定する機能を備える。
The priority
図14は、第2の実施形態における逐次発生データ解析システムの物理的なサーバ構成の例を示すブロック図である。図14に示すように、本実施形態における逐次発生データ解析システムを構成する場合、解析命令履歴手段9を、例えば、データ解析受付サーバ104が備えるように構成すればよい。ただし、図14に示す例は一例であり、例えば、解析命令履歴手段9をデータ高速解析サーバ105が備えるようにしてもよく、解析命令受付手段6と通信を行うことによって解析命令の履歴情報を受け取る(入力する)ようにしてもよい。
FIG. 14 is a block diagram illustrating an example of a physical server configuration of the sequential data analysis system according to the second embodiment. As shown in FIG. 14, when configuring the sequential generation data analysis system according to the present embodiment, the analysis
解析命令履歴手段9は、サービス提供手段1が要求した解析要求のクエリの履歴情報を記憶する。この場合、解析命令履歴手段9は、解析命令受付手段6を経由して入力する解析要求のクエリに従って、解析命令履歴情報を記憶する。すなわち、解析命令受付手段6は、解析要求のクエリを受け付ける(入力する)度に、解析命令履歴手段9に履歴情報を登録する。
The analysis
図15は、解析命令履歴手段9が記憶する解析命令履歴情報の例を示す説明図である。図15に示すように、解析命令履歴手段9は、日時(T09−01)と、URL(T09−02)とを対応付けて記憶する。なお、日時(T09−01)は、解析命令受付手段6が解析要求のクエリを受け付けた日時である。また、URL(T09−02)は、コマンドGetReferrerRankingを含むクエリで指定されているURLパラメータの値である。
FIG. 15 is an explanatory diagram showing an example of analysis command history information stored in the analysis command history means 9. As shown in FIG. 15, the analysis
優先事前解析判定手段805は、事前解析対象生成手段802から解析対象のデータの追加URLを受け取り(入力し)、それぞれの追加URLの出現頻度を、解析命令履歴手段9が記憶するURL(T09−02)に基づいてカウントする。また、優先事前解析判定手段805は、このカウントした数に応じて追加URLを降順にソートして、そのソート結果を事前解析対象生成手段802に返す(出力する)。
The priority
なお、優先事前解析判定手段805は、出現頻度のカウントを行う場合、例えば、追加URL毎に、解析命令履歴手段9が記憶するURLフィールド(T09−02)のURLをマッチング(照合)してレコード数をカウントすればよい。
In addition, when counting the appearance frequency, the priority
また、事前解析対象生成手段802は、ソート済みの追加URLを受け取ると(入力すると)、ソートされた追加URLのうち、先頭から順に解析手段5に1つずつ解析処理を依頼する制御を行う。
In addition, when the pre-analysis
一般的に、解析手段5が実行する解析処理にかかる解析時間は、数分から数時間かかる重い処理である。そのため、第1の実施形態で示した逐次発生データ解析システムのように、解析対象として求めた追加URLのデータを一括して一気に解析すると、膨大な解析時間がかかることがあり、しばらく解析結果が返ってこない。この場合、解析処理を実行している間、解析結果記憶手段7が記憶する事前解析を更新できないことになってしまい改善の余地がある。
Generally, the analysis time required for the analysis process executed by the
例えば、実際の解析サービスの利用態様を考慮すると、事前解析の処理が行われ解析結果記憶手段7に記憶される情報の中には、事業者ユーザによって提供を要求されるものもあれば、実際には全く要求されないものもありうる。このような場合に、事前解析処理を一括して行うようにしてしまうと、全ての解析処理が終了するまでは、事前解析結果を利用することができず、却って利用頻度の高い解析結果の提供を高速に受けられなくなってしまう可能がある。また、実際には事業者ユーザに利用されないにもかかわらず、長時間にわたって無駄な事前解析処理を行うような事態が生じてしまう可能性もありうる。 For example, in consideration of the actual usage mode of the analysis service, some of the information that is subjected to the pre-analysis process and stored in the analysis result storage means 7 may be requested by the operator user. Some may not be required at all. In such a case, if the pre-analysis processing is performed in a batch, the pre-analysis results cannot be used until all the analysis processing is completed, and the analysis results that are frequently used are provided instead. May not be received at high speed. In addition, there is a possibility that a situation in which a wasteful pre-analysis process is performed for a long time even though it is not actually used by a business user.
そこで、本実施形態では、事前解析対象のデータを一括して処理するのではなく、より出現頻度の高い解析要求のクエリに対するデータを優先的に事前解析することによって、事前解析処理を優先順位に従って時間分散して実行することにより、優先度の高いデータの解析結果を高速に得られなくなる事態を防止している。 Therefore, in the present embodiment, the pre-analysis processing is performed according to the priority order by pre-analyzing the data for the query of the analysis request having a higher appearance frequency instead of collectively processing the pre-analysis target data. By performing the processing in a time-distributed manner, it is possible to prevent a situation in which analysis results of high priority data cannot be obtained at high speed.
なお、本実施形態では、出現頻度に応じて事前解析処理の優先度を決める場合を示したが、事前解析処理の優先度の決め方は、本実施形態で示したものに限られず、例えば、解析時間の短い順に優先度を決定して事前解析処理を実行するようにしてもよい。 In the present embodiment, the case where the priority of the pre-analysis processing is determined according to the appearance frequency is shown, but the method of determining the priority of the pre-analysis processing is not limited to that shown in the present embodiment. Prior analysis processing may be executed by determining priorities in order of increasing time.
次に、動作について説明する。図16は、第2の実施形態における逐次発生データ解析システムが逐次発生データの解析を行う処理の一例を示す流れ図である。図16に示すように、本実施形態では、解析命令受付手段6は、解析命令受付ステップ(ステップS501)の処理を実行した後に、解析命令受付ステップ(ステップS501)で受け付けた解析要求のクエリの履歴を示す解析命令履歴情報を蓄積する解析命令履歴ステップ(ステップS506)の処理を実行する。そして、解析命令受付手段6は、解析命令履歴ステップ(ステップS506)の処理を実行した後に、事前解析利用可能性チェックステップ(ステップS502)の処理を実行する。 Next, the operation will be described. FIG. 16 is a flowchart illustrating an example of processing in which the sequentially generated data analysis system according to the second embodiment analyzes sequentially generated data. As shown in FIG. 16, in the present embodiment, the analysis command receiving means 6 executes the processing of the analysis command receiving step (step S501) and then executes the query of the analysis request received in the analysis command receiving step (step S501). An analysis command history step (step S506) for storing analysis command history information indicating a history is executed. Then, the analysis command receiving means 6 executes the processing of the pre-analysis availability check step (step S502) after executing the processing of the analysis command history step (step S506).
また、図17は、第2の実施形態における事前解析処理の一例を示す流れ図である。図17に示すように、本実施形態では、事前解析制御手段8は、事前解析ステップ(ステップS4)の解析対象変化検出ステップ(ステップS402)の処理を実行した後に、解析命令履歴情報の中に多く出現する命令ほど優先的に事前解析するように解析履歴数をカウントし、優先度を判定する優先時全解析判定ステップ(ステップS402)の処理を実行する。そして、事前解析制御手段8は、優先時全解析判定ステップ(ステップS402)の処理を実行した後に、事前解析対象決定ステップ(ステップS403)の処理を実行する。
FIG. 17 is a flowchart illustrating an example of a pre-analysis process in the second embodiment. As shown in FIG. 17, in this embodiment, the
なお、本実施形態では、例えば、解析命令履歴ステップ(ステップS506)の処理は、解析命令受付手段6が履歴情報を解析命令履歴手段9に記憶させることによって実行される。また、優先事前解析判定ステップ(ステップS407)の処理は、優先事前解析判定手段805によって実行される。
In the present embodiment, for example, the processing of the analysis command history step (step S506) is executed by causing the analysis
以上のように、本実施形態によれば、解析命令履歴手段9と優先事前解析判定手段805とにより、事業者ユーザからの解析要求を受けた頻度を考慮して、事前解析を実行する優先度を判定し、判定した優先度に従って事前解析を時間分散して実行する。そのため、より効果的に高速な解析処理を実行することを可能とすることができる。
As described above, according to the present embodiment, the priority level for executing the pre-analysis in consideration of the frequency of the analysis request received from the operator user by the analysis
実施形態3.
次に、本発明の第3の実施形態を図面を参照して説明する。図18は、第3の実施形態における逐次発生データ解析システムの構成の一例を示すブロック図である。また、図19は、第3の実施形態における事前解析制御手段8のより詳細な構成例を示すブロック図である。
Next, a third embodiment of the present invention will be described with reference to the drawings. FIG. 18 is a block diagram illustrating an example of a configuration of a sequential generation data analysis system according to the third embodiment. FIG. 19 is a block diagram showing a more detailed configuration example of the preliminary analysis control means 8 in the third embodiment.
図18に示すように、本実施形態では、逐次発生データ解析システムが、図1に示した構成要素に加えて、解析コスト監視手段10を含む点で、第1の実施形態と異なる。なお、逐次発生データ解析システムは、第2の実施形態で示した構成要素に加えて解析コスト監視手段10を含むように構成されてもよい。
As shown in FIG. 18, this embodiment is different from the first embodiment in that the sequential data analysis system includes an analysis
解析コスト監視手段10は、具体的には、プログラムに従って動作する情報処理装置のCPU、及びメモリ等の記憶装置によって実現される。解析コスト監視手段10は、解析手段5が実行する各解析処理にかかった時間を監視する機能を備える。
Specifically, the analysis
また、図19に示すように、本実施形態では、事前解析制御手段8が、図8に示した構成要素に加えて、優先事前解析判定手段805Aを含む点で、第1の実施形態と異なる。 Further, as shown in FIG. 19, the present embodiment is different from the first embodiment in that the prior analysis control means 8 includes priority prior analysis determination means 805A in addition to the components shown in FIG. .
優先事前解析判定手段805Aは、解析コスト監視手段10の監視結果に基づいて、事前解析制御手段8によって解析コストが高い命令を優先的に事前解析する制御がされるように、優先度を判定する機能を備える。なお、優先事前解析判定手段805Aは、第2の実施形態で示した優先事前解析判定手段805と同様の優先度判定機能も備えていてもよい。
Based on the monitoring result of the analysis
図20は、第3の実施形態における解析コスト監視手段10のより詳細な構成例を示すブロック図である。図20に示すように、解析コスト監視手段10は、解析コスト算出手段1001及び解析コスト記憶手段1002を含む。
FIG. 20 is a block diagram illustrating a more detailed configuration example of the analysis
解析コスト算出手段1001は、解析開始の時間を一時的にメモリ等の記憶装置に記憶しておき、解析終了の時間を解析手段5から受け取った(入力した)タイミングで、例えば、解析にかかった時間を算出することによって、解析のコストを算出する機能を備える。また、解析コスト記憶手段1002は、解析コスト算出手段1001の算出結果(解析処理毎の解析コスト)を記憶する。
The analysis
図21は、第3の実施形態における逐次発生データ解析システムの物理的なサーバ構成の例を示すブロック図である。図21に示すように、本実施形態における逐次発生データ解析システムを構成する場合、の解析コスト監視手段10を、例えば、解析サーバ102が備えるように構成すればよい。ただし、図21に示す例は一例であり、例えば、解析コスト監視手段10をデータ高速解析サーバ105が備えるようにしてもよく、解析手段5と通信を行うことによって解析状況を受け取る(入力する)ようにしてもよい。
FIG. 21 is a block diagram illustrating an example of a physical server configuration of a sequential data analysis system according to the third embodiment. As shown in FIG. 21, when configuring the sequential generation data analysis system in the present embodiment, the analysis cost monitoring means 10 may be configured to be included in the
解析手段5は、解析処理を実行する際に、解析開始と解析終了とのタイミングで、それぞれ開始命令と終了命令とを解析コスト監視手段10に出力する。例えば、解析手段5は、以下に示すフォーマットで開始命令や終了命令を出力する。
When executing the analysis processing, the
解析開始:
開始命令のフォーマット:(StartAnalysis ,解析対象のデータのURL)
例:(StartAnalysis ,”http://bar.co.jp/~foo/Page-001”)Start analysis:
Start command format: (StartAnalysis, URL of data to be analyzed)
Example: (StartAnalysis, “http://bar.co.jp/~foo/Page-001”)
解析終了:
終了命令のフォーマット:(EndAnalysis ,解析対象のデータのURL)
例:(EndAnalysis ,”http://bar.co.jp/~foo/Page-001”)End of analysis:
End instruction format: (EndAnalysis, URL of data to be analyzed)
Example: (EndAnalysis, “http://bar.co.jp/~foo/Page-001”)
ここで、StartAnalysis とEndAnalysis とは、コマンド名である。なお、開始命令や終了命令に含まれるコマンド名は、上記に示した表現のものに限られない。また、開始命令や終了命令のフォーマット自体も一例であり、上記に示した表現のものに限られない。 Here, StartAnalysis and EndAnalysis are command names. Note that the command names included in the start instruction and the end instruction are not limited to the expressions shown above. Further, the format of the start instruction and the end instruction itself is also an example, and is not limited to the expression shown above.
解析コスト算出手段1001は、解析手段から、StartAnalysis のコマンドを含む開始命令と、EndAnalysis のコマンドを含む終了命令とを受け取る(入力する)。そして、解析コスト算出手段1001は、開始命令と終了命令とを入力した時間差を求めることによって、各解析処理にかかるコスト(時間)を算出する。
The analysis cost calculation means 1001 receives (inputs) from the analysis means a start instruction including a StartAnalysis command and an end instruction including an EndAnalysis command. Then, the analysis
図22は、解析コスト算出手段1001が記憶する情報の例を示す説明図である。図22に示すように、解析コスト算出手段1001は、StartAnalysis のコマンドを含む開始命令を受けた際に、開始時間をURL毎に対応付けてテーブルとして記憶する。なお、図22において、URL(T10−01)は、解析を開始したデータのURLである。また、解析開始時間(T10−02)は、解析を開始した時間である。
FIG. 22 is an explanatory diagram illustrating an example of information stored in the analysis
解析コスト算出手段1001は、EndAnalysis のコマンドを含む終了命令を受けた(入力した)際には、この終了命令に含まれるURLの値と、記憶するURL(T10−01)とをマッチイング(照合)する。次いで、解析コスト算出手段1001は、合致したURLに対応する解析開始時間(T10−02)を抽出する。そして、解析コスト算出手段1001は、抽出した解析開始時間(T10−02)の値と現在時刻との差を求めることによって、この解析処理にかかったコストを算出する。
When the analysis
解析コスト記憶手段1002は、解析コスト算出手段1001から解析処理のコストの算出結果を受け取り(入力し)記憶する。この場合、解析コスト算出手段1001は、例えば、以下に示すフォーマットで解析コストの算出結果を出力する。
The analysis
解析コストの算出結果のフォーマット:(SetCost 、解析のURL、解析コスト)
例:(SetCost ,”http://bar.co.jp/~foo/Page-001,10)Analysis cost calculation result format: (SetCost, URL of analysis, analysis cost)
Example: (SetCost, “http://bar.co.jp/~foo/Page-001, 10)
また、解析コスト記憶手段1002は、解析コストの算出結果を、図23に示すフォーマットのテーブルとして記憶する。なお、図23において、URL(T10−03)は、解析対象データのURLである。また、解析コスト(T10−04)は、解析コスト算出手段1001が求めた解析にかかった時間の合計である。
The analysis
解析コスト算出手段1001は、SetCost 命令を出力し、この命令のURLの値をキーとして、解析コスト記憶手段1002が記憶するテーブルのURLフィールド(T10−03)を検索する。そして、解析コスト算出手段1001は、この検索して特定したレコードの解析コストフィールド(T10−04)の値と、SetCost 命令に含まれる解析コストとの合計を、解析コスト記憶手段1002が記憶する解析コストフィールド(T10−04)の値に上書きさせる。
The analysis
なお、本実施形態で示した解析処理のコスト計算方法は一例であり、解析コスト算出手段1001は、例えば、合計値ではなく、平均値等を解析コストとして求めてもよい。また、解析コスト算出手段1001が出力する命令のフォーマット等も一例であり、本実施形態で示したものに限られない。
Note that the cost calculation method of the analysis processing shown in the present embodiment is an example, and the analysis
事前解析制御手段8は、第2の実施形態では、解析命令履歴情報のデータ数に従って事前解析対象のデータの追加URLをソートする処理を実行していたが、本実施形態では、解析コスト記憶手段1002が記憶する解析コスト(T10−04)の値に従ってソートするようにすればよい。そして、事前解析制御手段8は、事前解析対象のデータを一括して処理するのではなく、例えば、解析コストが小さい順に優先処理することによって、時間的に分散処理するようにすればよい。
In the second embodiment, the
なお、解析コスト記憶手段1002には、解析手段5でまだ一度も解析処理が実行されていない場合には、まだエントリがない。この場合には、解析コスト記憶手段1002に、予め固定値(デフォルト値)を計算コストとして記憶させておく等、運用でカバーするようにすればよい。
Note that there is no entry in the analysis
また、第2の実施形態で示した優先度の判定処理と、第3の実施形態で示した優先度の判定処理とを組み合わせて用いるようにしてもよい。この場合には、優先事前解析判定手段805は、カウントの値と解析コストの値とを適当なウエイトで合計したスコアを求めて、その求めたスコアに従って解析対象のデータの追加URLをソートすればよい。なお、このソート方法は一例であり、優先事前解析判定手段805が、カウントの値と解析コストの値とに基づいて、解析対象のデータの追加URLをソートする方法は、本実施形態で示した方法に限られない。
Further, the priority determination process shown in the second embodiment and the priority determination process shown in the third embodiment may be used in combination. In this case, the priority
次に、動作について説明する。図24は、第3の実施形態における逐次発生データ解析システムが逐次発生データの解析を行う処理の一例を示す流れ図である。図24に示すように、本実施形態では、第1の実施形態や第2の実施形態で示した処理に加えて、解析コスト監視手段10は、解析コスト監視ステップ(ステップS6)の処理を実行する。 Next, the operation will be described. FIG. 24 is a flowchart illustrating an example of processing in which the sequentially generated data analysis system according to the third embodiment analyzes sequentially generated data. As shown in FIG. 24, in this embodiment, in addition to the processing shown in the first embodiment and the second embodiment, the analysis cost monitoring means 10 executes the processing of the analysis cost monitoring step (step S6). To do.
また、図25は、第3の実施形態における事前解析処理の一例を示す流れ図である。図25に示すように、本実施形態では、事前解析制御手段8は、解析対象変化検出ステップ(ステップS402)の処理を実行した後に、解析コスト監視ステップ(ステップS6)で算出した各解析処理のコストを用いて事前解析すべきデータの優先度付けを判定する優先事前解析判定ステップ(ステップS407)の処理を実行する。また、事前解析制御手段8は、優先事前解析判定ステップ(ステップS407)の処理を実行した後に、事前解析対象決定ステップ(ステップS403)の処理を実行する。
FIG. 25 is a flowchart illustrating an example of the pre-analysis process in the third embodiment. As shown in FIG. 25, in the present embodiment, the prior
なお、本実施形態では、例えば、解析コスト監視ステップ(ステップS6)の処理は、解析コスト監視手段10によって実行される。また、優先事前解析判定ステップ(ステップS407)の処理は、優先事前解析判定手段805によって実行される。
In the present embodiment, for example, the analysis cost monitoring step (step S6) is executed by the analysis cost monitoring means 10. Further, the process of the priority pre-analysis determination step (step S407) is executed by the priority
以上のように、本実施形態によれば、解析コスト監視手段10により、解析処理にかかる時間を考慮して、事前解析を実行する優先度を判定し、判定した優先度に従って事前解析を時間分散して実行する。そのため、より効果的に高速な解析処理を実行することを可能とすることができる。
As described above, according to the present embodiment, the analysis
なお、本実施形態において、さらに、第2の実施形態と同様に、解析命令履歴手段9も備えるように構成するようにしてもよい。そのように構成すれば、解析処理にかかる時間に加えて、さらに事業者ユーザからの解析要求を受けた頻度も考慮して、事前解析を実行する優先度を判定し、判定した優先度に従って事前解析を時間分散して実行することができる。そのため、さらに、より効果的に高速な解析処理を実行することを可能とすることができる。 In the present embodiment, as in the second embodiment, the analysis command history means 9 may also be provided. With such a configuration, in addition to the time required for the analysis process, the frequency of receiving the analysis request from the operator user is also considered, and the priority for executing the pre-analysis is determined, and the priority is determined in advance according to the determined priority. Analysis can be performed with time dispersion. Therefore, it is possible to more efficiently execute high-speed analysis processing.
実施形態4.
次に、本発明の第4の実施形態を図面を参照して説明する。図26は、第4の実施形態における事前解析制御手段8のより詳細な構成例を示すブロック図である。図26に示すように、本実施形態では、事前解析制御手段8が、図8に示した構成要素に加えて、空き記憶容量監視手段806を含む点で、第1の実施形態と異なる。なお、事前解析制御手段8は、第2の実施形態又は第3の実施形態で示した構成要素に加えて空き記憶容量監視手段806を含むように構成されていてもよい。
Next, a fourth embodiment of the present invention will be described with reference to the drawings. FIG. 26 is a block diagram showing a more detailed configuration example of the preliminary
空き記憶容量監視手段806は、事前に解析する対象とするデータを絞り込むために、事前解析制御手段8が動作する情報処理装置(PC)のメモリ等のリソースの空き容量を監視する機能を備える。
The free storage
空き記憶容量監視手段806は、リソースの空き容量と事前解析可能なデータ数との関係を設定したテーブルに事前にセットしている。そして、空き記憶容量監視手段806は、予めセットしたテーブルに従って、事前解析可能なデータ数を求める。
The free storage capacity monitoring means 806 is set in advance in a table in which the relationship between the free capacity of resources and the number of data that can be analyzed in advance is set. The free storage
図27は、空き記憶容量監視手段806が予め設定するテーブルの例を示す説明図である。図27に示すように、空き記憶容量監視手段806は、予め空き記憶容量(T0806−01)と事前解析可能数(T0806−02)とを対応付けたテーブルをセットする。なお、空き記憶容量(T0806−01)は、事前解析制御手段8が動作する情報処理装置が備えるメモリ等のリソースの全容量のうち、利用可能な空き記憶容量である。また、事前解析可能数(T0806−02)は、その空き記憶容量に対する事前解析可能なデータの最大数である。
FIG. 27 is an explanatory diagram showing an example of a table preset by the free storage
空き記憶容量監視手段806は、事前解析対象生成手段802から事前解析可能なデータ数の問い合わせを受けると(算出要求を入力すると)、事前解析制御手段8が動作する情報処理装置(PC)のシステムコールからメモリ等のリソースの空き記憶容量を取得(抽出)する。そして、空き記憶容量監視手段806は、抽出した空き記憶容量に基づいて、図27に示すテーブルから、対応する事前解析可能数を抽出する。そのように処理することによって、空き記憶容量監視手段806は、事前解析可能な数を算出し、事前解析対象生成手段802に対して算出結果を返答(出力)する。例えば、図27に示す例の場合、空き記憶容量監視手段806は、空き容量を700Kbyteと抽出したときには、事前解析可能なデータ数を50と算出して回答(出力)する。
When the free storage
なお、事前解析制御手段8が動作する情報処理装置において複数のアプリケーションが動作している場合には、空き記憶容量監視手段806は、同じ情報処理装置上で動作する他のアプリケーションで使用されるメモリ容量も考量して監視するようにしてもよい。
When a plurality of applications are operating in the information processing apparatus in which the prior
事前解析対象生成手段802は、事前解析対象を決定する際に、空き記憶容量監視手段806に事前解析可能数を問い合わせて、事前解析可能なデータ数を取得(算出結果を入力)する。そして、事前解析対象生成手段802は、事前解析可能なデータ数よりも、事前解析対象のデータ数の方が多い場合には、解析対象のデータを絞り込む処理を行う。
The pre-analysis
なお、事前解析対象生成手段802は、事前解析対象のデータの絞り込みを行う場合、例えば、第2の実施形態や第3の実施形態のように、事前解析対象のデータの追加URLが優先度に従ってソートされている場合には、優先度の低いものから順に、事前解析の候補から削除すればよい。また、第1の実施形態のように追加URLのソートを行っていない場合には、事前解析対象生成手段802は、事前解析対象のデータをランダムに削除するようにすればよい。
Note that the pre-analysis
次に、動作について説明する。図28は、第4の実施形態における逐次発生データ解析システムが逐次発生データの解析を行う処理の一例を示す流れ図である。図28に示すように、本実施形態では、第1の実施形態や第2の実施形態、第3の実施形態で示した処理に加えて、事前解析制御手段8は、情報処理装置(PC)のメモリ等のリソースの空き容量に基づいて、事前に解析可能なデータ数を見積る空き記憶容量監視ステップ(ステップS7)の処理を実行する。 Next, the operation will be described. FIG. 28 is a flowchart illustrating an example of processing in which the sequentially generated data analysis system according to the fourth embodiment analyzes sequentially generated data. As shown in FIG. 28, in this embodiment, in addition to the processing shown in the first embodiment, the second embodiment, and the third embodiment, the prior analysis control means 8 is an information processing apparatus (PC). Based on the free capacity of the resource such as the memory, the processing of the free storage capacity monitoring step (step S7) for estimating the number of data that can be analyzed in advance is executed.
また、図29は、第4の実施形態における事前解析処理の一例を示す流れ図である。図29に示すように、本実施形態では、事前解析制御手段8は、解析対象変化検出ステップ(ステップS402)の処理を実行した後に、空き記憶容量監視ステップ(ステップS7)の処理で算出した解析可能なデータ数に基づいて、事前解析の対象データを絞り込む事前解析対象絞り込みステップ(ステップS408)の処理を実行する。また、事前解析制御手段8は、事前解析対象絞り込みステップ(ステップS408)の処理を実行した後に、事前解析対象決定ステップ(ステップS403)の処理を実行する。
FIG. 29 is a flowchart illustrating an example of a pre-analysis process according to the fourth embodiment. As shown in FIG. 29, in this embodiment, the pre-analysis control means 8 performs the analysis calculated in the process of the free storage capacity monitoring step (step S7) after executing the process of the analysis object change detection step (step S402). Based on the number of possible data, the process of the pre-analysis target narrowing step (step S408) for narrowing down the pre-analysis target data is executed. In addition, the
なお、本実施形態では、例えば、空き記憶容量監視ステップ(ステップS7)の処理は、空き記憶容量監視手段806によって実行される。また、事前解析対象絞り込みステップ(ステップS408)の処理は、優先事前解析判定手段802によって実行される。
In this embodiment, for example, the process of the free storage capacity monitoring step (step S7) is executed by the free storage
以上のように、本実施形態によれば、空き記憶容量監視手段806により、解析処理を実行する情報処理装置(PC)の空きリソース等を考慮して、事前解析を実行する優先度を判定し、事前解析対象とするデータを絞り込む。そのため、解析処理を実行する情報処理装置のリソース不足により事前解析を行えなくなる事態を防止することができ、より効果的に高速な解析処理を実行することを可能とすることができる。
As described above, according to the present embodiment, the free storage
次に、本発明による逐次発生データ解析装置の最小構成について説明する。図30は、逐次発生データ解析装置の最小の構成例を示すブロック図である。図30に示すように、逐次発生データ解析装置は、最小の構成要素として、事前解析制御手段8を含む。図30において、事前解析制御手段8は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う機能を備える。
Next, the minimum configuration of the sequential data analysis apparatus according to the present invention will be described. FIG. 30 is a block diagram illustrating a minimum configuration example of the sequential generation data analysis apparatus. As shown in FIG. 30, the sequential generation data analysis apparatus includes a
図30に示す最小構成の逐次発生データ解析装置によれば、逐次的に発生するデータを収集して解析する場合であっても、サービス毎のレスポンスタイムの要望に応じた解析を行うことができる。 According to the minimally generated sequential data analysis apparatus shown in FIG. 30, even if data generated sequentially is collected and analyzed, it is possible to perform analysis in response to a request for response time for each service. .
なお、上記に示した各実施形態では、以下の(1)〜(18)に示すような逐次発生データ解析装置の特徴的構成が示されている。 In each of the embodiments described above, the characteristic configuration of the sequential generation data analysis apparatus as shown in the following (1) to (18) is shown.
(1)逐次発生データ解析装置(例えば、データ高速解析サーバ105。例えば、解析サーバ102、データ解析受付サーバ104、及びデータ高速解析サーバ105を実現する情報処理装置。)は、解析要求よりも前に、逐次発生するデータである逐次発生データ(例えば、Webサーバが出力するログデータ、温度センサや湿度センサが出力するデータ)を事前解析する処理を実行させる制御を行う事前解析制御手段(例えば、事前解析制御手段8によって実現される)を備えたことを特徴とする。
(1) Sequentially generated data analysis devices (for example, the data high-
(2)また、逐次発生データ解析装置は、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析制御手段による制御によって事前解析されているか否かを判定する解析方法判定手段(例えば、解析命令受付手段6によって実現される)を備え、解析方法判定手段は、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力するように構成されていてもよい。 (2) Further, the sequential generation data analysis device is configured to analyze whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control unit when an analysis request is generated ( For example, when the analysis method determination unit determines that the analysis is not performed in advance, the analysis method determination unit performs control to execute processing for analyzing the sequentially generated data to be analyzed, and the analysis result May be configured to output an analysis result that has already been pre-analyzed.
(3)また、逐次発生データ解析装置は、事前解析制御手段による制御によって事前解析された事前解析結果を記憶する事前解析結果記憶手段(例えば、解析結果記憶手段7によって実現される)を備え、解析方法判定手段は、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶手段に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定するように構成されていてもよい。 (3) Further, the sequential generation data analysis apparatus includes a pre-analysis result storage unit (for example, realized by the analysis result storage unit 7) that stores a pre-analysis result pre-analyzed by control by the pre-analysis control unit, The analysis method determining means determines whether the analysis target is generated sequentially by determining whether or not the pre-analysis result corresponding to the sequential generation data to be analyzed is stored in the pre-analysis result storage means when the analysis request is generated. It may be configured to determine whether the data has already been pre-analyzed.
(4)また、逐次発生データ解析装置において、事前解析制御手段は、予め設定された、事前解析する対象とする条件を示す事前解析条件(例えば、サービス要件)に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行うように構成されていてもよい。 (4) Further, in the sequential generation data analysis apparatus, the pre-analysis control means sets a pre-analysis target based on a pre-analysis condition (for example, service requirement) indicating a target condition to be pre-set. It may be configured to perform control for determining the sequentially generated data and executing a process of analyzing the sequentially generated data in advance.
(5)また、逐次発生データ解析装置において、事前解析制御手段は、逐次発生データの発生状況を監視する逐次発生データ監視手段(例えば、解析対象監視手段801によって実現される)と、逐次発生データ監視手段の監視結果と、事前解析条件設定手段によって設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する事前解析対象特定手段(例えば、事前解析対象生成手段802によって実現される)と、事前解析対象特定手段が特定した事前解析対象の逐次発生データの解析を実行させる制御を行う事前解析実行制御手段(例えば、事前解析依頼手段803によって実現される)と、事前解析実行制御手段の制御により実行された事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶手段に記憶させる事前解析結果登録手段(例えば、事前解析結果登録手段804によって実現される)とを含むように構成されていてもよい。 (5) Further, in the sequential generation data analyzing apparatus, the prior analysis control unit includes a sequential generation data monitoring unit (for example, realized by the analysis target monitoring unit 801) for monitoring the generation status of the sequential generation data, and the sequential generation data. Based on the monitoring result of the monitoring means and the pre-analysis condition set by the pre-analysis condition setting means, a pre-analysis target specifying means (for example, pre-analysis) that specifies sequential generation data to be pre-analyzed preferentially And a pre-analysis execution control unit (for example, a pre-analysis requesting unit 803) that performs control to execute analysis of sequentially generated data of the pre-analysis target specified by the pre-analysis target specifying unit. Pre-analysis that stores the pre-analysis results of the analysis results of the pre-analysis executed by the control of the pre-analysis execution control means Pre-analysis result registration means for storing the result storage means (for example, implemented by prior analysis result registration means 804) and may be configured to include.
(6)また、逐次発生データ解析装置は、解析要求の履歴情報を記憶する解析要求履歴記憶手段(例えば、解析命令履歴手段9によって実現される)を備え、事前解析制御手段は、解析要求履歴記憶手段が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する出現頻度優先事前解析判定手段(例えば、優先事前解析判定手段805によって実現される)を含むように構成されていてもよい。 (6) Further, the sequential generation data analysis apparatus includes an analysis request history storage unit (for example, realized by the analysis command history unit 9) for storing analysis request history information, and the prior analysis control unit includes an analysis request history Appearance for determining the priority of sequential data to be pre-analyzed based on historical information stored in the storage means so that sequential data corresponding to an analysis request with a high frequency of occurrence is preferentially analyzed. It may be configured to include a frequency priority pre-analysis determination unit (for example, realized by the priority pre-analysis determination unit 805).
(7)また、逐次発生データ解析装置は、逐次発生データの解析にかかった解析コストを監視する解析コスト監視手段(例えば、解析コスト監視手段10によって実現される)を備え、事前解析制御手段は、解析コスト監視手段の監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する解析コスト優先事前解析判定手段(例えば、優先事前解析判定手段805Aによって実現される)を含むように構成されていてもよい。 (7) Further, the sequential generation data analyzing apparatus includes an analysis cost monitoring unit (for example, realized by the analysis cost monitoring unit 10) for monitoring an analysis cost for analyzing the sequentially generated data. And an analysis cost priority pre-analysis determination unit (for example, realized by the priority pre-analysis determination unit 805A) that determines the priority of sequentially generated data to be pre-analyzed based on the monitoring result of the analysis cost monitoring unit. It may be configured.
(8)また、逐次発生データ解析装置において、解析コスト監視手段は、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出する解析コスト算出手段(例えば、解析コスト算出手段1001によって実現される)と、解析コスト算出手段の算出結果を記憶する解析コスト記憶手段(例えば、解析コスト記憶手段1002によって実現される)とを含むように構成されていてもよい。 (8) Further, in the sequential generation data analysis device, the analysis cost monitoring means temporarily stores a start time which is a time when the analysis of the sequential generation data is started, and performs the analysis when the analysis of the sequential generation data is finished. Based on the end time that is the end time and the temporarily stored start time, an analysis cost calculation unit that calculates the analysis cost (for example, realized by the analysis cost calculation unit 1001), and a calculation result of the analysis cost calculation unit Analysis cost storage means (for example, realized by the analysis cost storage means 1002).
(9)また、逐次発生データ解析装置は、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視手段(例えば、空き記憶容量監視手段806によって実現される)を備え、事前解析制御手段は、リソース監視手段の監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込むように構成されていてもよい。 (9) Further, the sequential data analysis apparatus includes resource monitoring means (for example, realized by the free storage capacity monitoring means 806) for monitoring the free capacity of the resource of the information processing apparatus used for the analysis processing of the sequentially generated data. The pre-analysis control unit may be configured to narrow down sequentially generated data to be pre-analyzed based on the monitoring result of the resource monitoring unit.
(10)逐次発生データ解析装置は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御部を備えるように構成されていてもよい。 (10) The sequential generation data analysis device may be configured to include a prior analysis control unit that performs control to execute a process of performing preliminary analysis on sequential generation data that is sequentially generated before an analysis request. Good.
(11)また、逐次発生データ解析装置は、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析制御部による制御によって事前解析されているか否かを判定する解析方法判定部を備え、解析方法判定部は、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力するように構成されていてもよい。 (11) Further, the sequential generation data analysis device includes an analysis method determination unit that determines whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control unit when an analysis request is generated. If the analysis method determination unit determines that the analysis is not performed in advance, the analysis method determination unit performs a process of analyzing the sequentially generated data to be analyzed, outputs the analysis result, and determines that the analysis is already performed in advance. The analysis result that has already been analyzed in advance may be output.
(12)また、逐次発生データ解析装置は、事前解析制御部による制御によって事前解析された事前解析結果を記憶する事前解析結果記憶部を備え、解析方法判定部は、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶部に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定するように構成されていてもよい。 (12) In addition, the sequential generation data analysis device includes a pre-analysis result storage unit that stores a pre-analysis result pre-analyzed by control by the pre-analysis control unit, and the analysis method determination unit is configured to generate an analysis request when the analysis request is generated. By determining whether or not the pre-analysis result corresponding to the sequentially generated data to be analyzed is stored in the pre-analysis result storage unit, it is determined whether or not the sequentially generated data to be analyzed has already been pre-analyzed. It may be configured as follows.
(13)また、逐次発生データ解析装置において、事前解析制御部は、予め設定された、事前解析する対象とする条件を示す事前解析条件に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行うように構成されていてもよい。 (13) In the sequential data analysis device, the pre-analysis control unit determines sequential data to be pre-analyzed based on a pre-analysis condition that is set in advance and indicates a condition to be pre-analyzed. Further, it may be configured to perform control for executing processing for pre-analyzing the sequentially generated data.
(14)また、逐次発生データ解析装置において、事前解析制御部は、逐次発生データの発生状況を監視する逐次発生データ監視部と、逐次発生データ監視部の監視結果と、事前解析条件設定部によって設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する事前解析対象特定部と、事前解析対象特定部が特定した事前解析対象の逐次発生データの解析を実行させる制御を行う事前解析実行制御部と、事前解析実行制御部の制御により実行された事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶部に記憶させる事前解析結果登録部とを含むように構成されていてもよい。 (14) Further, in the sequential data analysis device, the pre-analysis control unit includes a sequential data monitoring unit that monitors a generation state of the sequential data, a monitoring result of the sequential data monitoring unit, and a pre-analysis condition setting unit. Based on the pre-analysis conditions that have been set, the pre-analysis target specifying unit that specifies sequential generation data to be pre-analyzed, and the pre-analysis target specifying unit specified by the pre-analysis target specifying unit Pre-analysis execution control unit that performs control to execute analysis, and pre-analysis result registration that stores the analysis result of the pre-analysis executed by the control of the pre-analysis execution control unit in the pre-analysis result storage unit that stores the pre-analysis result May be included.
(15)また、逐次発生データ解析装置は、解析要求の履歴情報を記憶する解析要求履歴記憶部を備え、事前解析制御部は、解析要求履歴記憶部が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する出現頻度優先事前解析判定部を含むように構成されていてもよい。 (15) The sequential generation data analysis apparatus includes an analysis request history storage unit that stores analysis request history information, and the prior analysis control unit generates an appearance frequency based on the history information stored in the analysis request history storage unit. It is configured to include an appearance frequency priority pre-analysis determination unit that determines the priority of sequential data to be pre-analyzed so that sequential data corresponding to a high analysis request is given priority. May be.
(16)また、逐次発生データ解析装置は、逐次発生データの解析にかかった解析コストを監視する解析コスト監視部を備え、事前解析制御部は、解析コスト監視部の監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する解析コスト優先事前解析判定部を含むように構成されていてもよい。 (16) Further, the sequential generation data analysis apparatus includes an analysis cost monitoring unit that monitors an analysis cost for analysis of the sequential generation data, and the prior analysis control unit is configured in advance based on the monitoring result of the analysis cost monitoring unit. An analysis cost priority prior analysis determination unit that determines the priority of the sequentially generated data to be analyzed may be included.
(17)また、逐次発生データ解析装置において、解析コスト監視部は、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出する解析コスト算出部と、解析コスト算出部の算出結果を記憶する解析コスト記憶部とを含むように構成されていてもよい。 (17) Further, in the sequential generation data analysis apparatus, the analysis cost monitoring unit temporarily stores a start time that is a time when the analysis of the sequential generation data is started, and performs the analysis when the analysis of the sequential generation data is finished. An analysis cost calculation unit that calculates an analysis cost based on an end time that is an end time and a temporarily stored start time, and an analysis cost storage unit that stores a calculation result of the analysis cost calculation unit May be.
(18)また、逐次発生データ解析装置は、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視部を備え、事前解析制御部は、リソース監視部の監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込むように構成されていてもよい。 (18) Further, the sequential generation data analysis apparatus includes a resource monitoring unit that monitors the free capacity of the resources of the information processing apparatus used for the analysis processing of the sequential generation data, and the prior analysis control unit displays the monitoring result of the resource monitoring unit. Based on this, it may be configured to narrow down sequentially generated data to be analyzed in advance.
また、上記に示した各実施形態では、以下の(19)〜(36)に示すような逐次発生データ解析システムの特徴的構成が示されている。 Moreover, in each embodiment shown above, the characteristic structure of the sequential generation data analysis system as shown to the following (19)-(36) is shown.
(19)逐次発生データ解析システムは、逐次発生するデータである逐次発生データを発生するデータ発生装置(例えば、アプリケーションサーバ101)と、データ発生手段が発生する逐次発生データの解析処理を実行する逐次発生データ解析装置(例えば、データ高速解析サーバ105。例えば、解析サーバ102、データ解析受付サーバ104、及びデータ高速解析サーバ105を実現する情報処理装置。)と、逐次発生データ解析装置の解析結果に基づいて、データ解析サービスを提供する処理を実行するサービス提供装置(例えば、データ解析サービスサーバ103)とを備え、逐次発生データ解析装置は、解析要求よりも前に、逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を含むことを特徴とする。
(19) The sequential generation data analysis system sequentially executes a data generation apparatus (for example, the application server 101) that generates sequential generation data that is sequential generation data, and analysis processing of the sequential generation data generated by the data generation unit. The analysis result of the generated data analysis device (for example, the data high-
(20)逐次発生データ解析システムにおいて、逐次発生データ解析装置は、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析制御手段による制御によって事前解析されているか否かを判定する解析方法判定手段を含み、解析方法判定手段は、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力するように構成されていてもよい。 (20) In the sequential generation data analysis system, the sequential generation data analysis apparatus determines whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control means when an analysis request is generated. If the analysis method determination means determines that it has not been pre-analyzed, the analysis method determination means performs control to execute processing for analyzing the sequentially generated data to be analyzed, outputs the analysis result, and has already been analyzed in advance. If it is determined that the result is already analyzed, the analysis result that has already been analyzed in advance may be output.
(21)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、事前解析制御手段による制御によって事前解析された事前解析結果を記憶する事前解析結果記憶手段を含み、解析方法判定手段は、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶手段に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定するように構成されていてもよい。 (21) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes a pre-analysis result storage unit that stores a pre-analysis result pre-analyzed by control by the pre-analysis control unit, and the analysis method determination unit includes: When an analysis request is generated, the analysis target sequential generation data is already pre-analyzed by determining whether the preliminary analysis result corresponding to the analysis target sequential generation data is stored in the preliminary analysis result storage means. It may be configured to determine whether or not.
(22)また、逐次発生データ解析システムにおいて、サービス提供装置は、事前解析する対象とする条件を示す事前解析条件を設定する事前解析条件設定手段(例えば、サービス要件設定手段2によって実現される)を含み、事前解析制御手段は、事前解析条件設定手段によって設定された事前解析条件に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行うように構成されていてもよい。 (22) Further, in the sequential generation data analysis system, the service providing apparatus sets a pre-analysis condition setting unit (for example, realized by the service requirement setting unit 2) that sets a pre-analysis condition indicating a condition to be pre-analyzed. And the pre-analysis control means determines the sequential generation data to be pre-analyzed based on the pre-analysis conditions set by the pre-analysis condition setting means, and executes a process of pre-analyzing the sequential generation data It may be configured to perform.
(23)また、逐次発生データ解析システムにおいて、事前解析制御手段は、逐次発生データの発生状況を監視する逐次発生データ監視手段と、逐次発生データ監視手段の監視結果と、事前解析条件設定手段によって設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する事前解析対象特定手段と、事前解析対象特定手段が特定した事前解析対象の逐次発生データの解析を実行させる制御を行う事前解析実行制御手段と、事前解析実行制御手段の制御により実行された事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶手段に記憶させる事前解析結果登録手段とを含むように構成されていてもよい。 (23) In the sequential generation data analysis system, the prior analysis control means includes a sequential generation data monitoring means for monitoring a generation status of the sequential generation data, a monitoring result of the sequential generation data monitoring means, and a preliminary analysis condition setting means. Based on the set pre-analysis conditions, the pre-analysis target specifying means for specifying the pre-analysis target data to be pre-analyzed and the pre-analysis target specifying means specifying the pre-analysis target specifying means Pre-analysis execution control means for performing control to execute analysis, and pre-analysis result registration for storing the analysis result of the pre-analysis executed by the control of the pre-analysis execution control means in the pre-analysis result storage means for storing the pre-analysis result Means may be included.
(24)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、解析要求の履歴情報を記憶する解析要求履歴記憶手段を含み、事前解析制御手段は、解析要求履歴記憶手段が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する出現頻度優先事前解析判定手段を含むように構成されていてもよい。 (24) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes an analysis request history storage unit that stores analysis request history information, and the prior analysis control unit stores the history stored in the analysis request history storage unit. Appearance frequency priority pre-analysis determination means for determining the priority of sequentially generated data to be pre-analyzed based on information so that sequential data corresponding to an analysis request having a high appearance frequency is preferentially analyzed May be included.
(25)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、逐次発生データの解析にかかった解析コストを監視する解析コスト監視手段を含み、事前解析制御手段は、解析コスト監視手段の監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する解析コスト優先事前解析判定手段を含むように構成されていてもよい。 (25) In the sequential generation data analysis system, the sequential generation data analysis device includes an analysis cost monitoring unit that monitors an analysis cost for analyzing the sequential generation data, and the prior analysis control unit includes the analysis cost monitoring unit. An analysis cost priority pre-analysis determination unit that determines the priority of sequentially generated data to be pre-analyzed based on the monitoring result may be included.
(26)また、逐次発生データ解析システムにおいて、解析コスト監視手段は、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出する解析コスト算出手段と、解析コスト算出手段の算出結果を記憶する解析コスト記憶手段とを含むように構成されていてもよい。 (26) In the sequential generation data analysis system, the analysis cost monitoring means temporarily stores a start time that is a time when the analysis of the sequential generation data is started, and performs the analysis when the analysis of the sequential generation data is finished. An analysis cost calculation unit that calculates an analysis cost based on an end time that is an end time and a temporarily stored start time, and an analysis cost storage unit that stores a calculation result of the analysis cost calculation unit May be.
(27)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視手段を含み、事前解析制御手段は、リソース監視手段の監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込むように構成されていてもよい。 (27) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes a resource monitoring unit that monitors the free capacity of the resource of the information processing apparatus used for the analysis process of the sequential generation data. Based on the monitoring result of the resource monitoring means, it may be configured to narrow down the sequentially generated data to be analyzed in advance.
(28)逐次発生データ解析システムは、逐次発生するデータである逐次発生データを発生するデータ発生装置と、データ発生部が発生する逐次発生データの解析処理を実行する逐次発生データ解析装置と、逐次発生データ解析装置の解析結果に基づいて、データ解析サービスを提供する処理を実行するサービス提供装置とを備え、逐次発生データ解析装置は、解析要求よりも前に、逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御部を含むように構成されていてもよい。 (28) A sequential generation data analysis system includes a data generation device that generates sequential generation data that is sequentially generated data, a sequential generation data analysis device that executes analysis processing of sequential generation data generated by a data generation unit, And a service providing device that executes a process for providing a data analysis service based on the analysis result of the generated data analysis device. The sequential generated data analysis device performs a process of pre-analyzing sequentially generated data before an analysis request. It may be configured to include a pre-analysis control unit that performs control to execute the above.
(29)逐次発生データ解析システムにおいて、逐次発生データ解析装置は、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析制御部による制御によって事前解析されているか否かを判定する解析方法判定部を含み、解析方法判定部は、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力するように構成されていてもよい。 (29) In the sequential generation data analysis system, the sequential generation data analysis apparatus determines whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control unit when an analysis request is generated. If the analysis method determination unit determines that it has not been pre-analyzed, the analysis method determination unit performs control to execute a process of analyzing sequentially generated data to be analyzed, outputs the analysis result, and has already been analyzed in advance. If it is determined that the result is already analyzed, the analysis result that has already been analyzed in advance may be output.
(30)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、事前解析制御部による制御によって事前解析された事前解析結果を記憶する事前解析結果記憶部を含み、解析方法判定部は、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶部に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定するように構成されていてもよい。 (30) In the sequential generation data analysis system, the sequential generation data analysis device includes a pre-analysis result storage unit that stores a pre-analysis result pre-analyzed by control by the pre-analysis control unit, and the analysis method determination unit includes: When an analysis request is generated, the analysis target sequential generation data is already pre-analyzed by determining whether the preliminary analysis result corresponding to the analysis target sequential generation data is stored in the preliminary analysis result storage unit. It may be configured to determine whether or not.
(31)また、逐次発生データ解析システムにおいて、サービス提供装置は、事前解析する対象とする条件を示す事前解析条件を設定する事前解析条件設定部を含み、事前解析制御部は、事前解析条件設定部によって設定された事前解析条件に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行うように構成されていてもよい。 (31) In the sequential generation data analysis system, the service providing apparatus includes a pre-analysis condition setting unit that sets a pre-analysis condition indicating a condition to be pre-analyzed, and the pre-analysis control unit is configured to set the pre-analysis condition. Based on the pre-analysis conditions set by the unit, it may be configured to determine the sequentially generated data to be pre-analyzed, and to perform control to execute a process of pre-analyzing the sequentially generated data.
(32)また、逐次発生データ解析システムにおいて、事前解析制御部は、逐次発生データの発生状況を監視する逐次発生データ監視部と、逐次発生データ監視部の監視結果と、事前解析条件設定部によって設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する事前解析対象特定部と、事前解析対象特定部が特定した事前解析対象の逐次発生データの解析を実行させる制御を行う事前解析実行制御部と、事前解析実行制御部の制御により実行された事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶部に記憶させる事前解析結果登録部とを含むように構成されていてもよい。 (32) In the sequential generation data analysis system, the prior analysis control unit includes a sequential generation data monitoring unit that monitors a generation state of the sequential generation data, a monitoring result of the sequential generation data monitoring unit, and a preliminary analysis condition setting unit. Based on the pre-analysis conditions that have been set, the pre-analysis target specifying unit that specifies sequential generation data to be pre-analyzed, and the pre-analysis target specifying unit specified by the pre-analysis target specifying unit Pre-analysis execution control unit that performs control to execute analysis, and pre-analysis result registration that stores the analysis result of the pre-analysis executed by the control of the pre-analysis execution control unit in the pre-analysis result storage unit that stores the pre-analysis result May be included.
(33)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、解析要求の履歴情報を記憶する解析要求履歴記憶部を含み、事前解析制御部は、解析要求履歴記憶部が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する出現頻度優先事前解析判定部を含むように構成されていてもよい。 (33) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes an analysis request history storage unit that stores analysis request history information, and the prior analysis control unit stores the history stored in the analysis request history storage unit. Based on the information, the appearance frequency priority pre-analysis determination unit that determines the priority of the sequentially generated data to be analyzed in advance so that the sequentially generated data corresponding to the analysis request having a high appearance frequency is preferentially analyzed. May be included.
(34)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、逐次発生データの解析にかかった解析コストを監視する解析コスト監視部を含み、事前解析制御部は、解析コスト監視部の監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する解析コスト優先事前解析判定部を含むように構成されていてもよい。 (34) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes an analysis cost monitoring unit that monitors an analysis cost for analyzing the sequential generation data, and the prior analysis control unit is an analysis cost monitoring unit. An analysis cost priority pre-analysis determination unit that determines the priority of sequentially generated data to be pre-analyzed based on the monitoring result may be included.
(35)また、逐次発生データ解析システムにおいて、解析コスト監視部は、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出する解析コスト算出部と、解析コスト算出部の算出結果を記憶する解析コスト記憶部とを含むように構成されていてもよい。 (35) Further, in the sequential generation data analysis system, the analysis cost monitoring unit temporarily stores a start time which is a time when the analysis of the sequential generation data is started, and performs the analysis when the analysis of the sequential generation data is finished. An analysis cost calculation unit that calculates an analysis cost based on an end time that is an end time and a temporarily stored start time, and an analysis cost storage unit that stores a calculation result of the analysis cost calculation unit May be.
(36)また、逐次発生データ解析システムにおいて、逐次発生データ解析装置は、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視部を含み、事前解析制御部は、リソース監視部の監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込むように構成されていてもよい。 (36) In the sequential generation data analysis system, the sequential generation data analysis apparatus includes a resource monitoring unit that monitors the free capacity of the resource of the information processing apparatus used for the analysis processing of the sequential generation data. Based on the monitoring result of the resource monitoring unit, it may be configured to narrow down sequentially generated data to be analyzed in advance.
また、上記に示した各実施形態では、以下の(37)〜(45)に示すような逐次発生データ解析方法の特徴的構成が示されている。 Moreover, in each embodiment shown above, the characteristic structure of the sequential generation data analysis method as shown to the following (37)-(45) is shown.
(37)逐次発生データ解析方法は、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御ステップを含むことを特徴とする。 (37) The sequential generation data analysis method includes a pre-analysis control step for performing control for executing a process of performing pre-analysis on sequential generation data that is sequentially generated before an analysis request.
(38)また、逐次発生データ解析方法は、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析されているか否かを判定する解析方法判定ステップを含み、解析方法判定ステップにおいて、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力するように構成されていてもよい。 (38) Further, the sequential generation data analysis method includes an analysis method determination step for determining whether or not the sequential generation data to be analyzed has already been analyzed in advance when an analysis request is generated. If it is determined that it has not been pre-analyzed, it performs control to analyze the sequentially generated data to be analyzed, outputs the analysis result, and if it has already been pre-analyzed, it has already been pre-analyzed The analysis result may be output.
(39)また、逐次発生データ解析方法は、事前解析された事前解析結果を事前解析結果記憶手段に記憶する事前解析結果記憶ステップを含み、解析方法判定ステップにおいて、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶手段に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定するように構成されていてもよい。 (39) Further, the sequential generation data analysis method includes a pre-analysis result storage step of storing the pre-analysis result pre-analyzed in the pre-analysis result storage means, and when an analysis request is generated in the analysis method determination step, By determining whether or not the pre-analysis result corresponding to the sequentially generated data to be analyzed is stored in the pre-analysis result storage unit, it is determined whether or not the sequentially generated data to be analyzed has already been pre-analyzed. It may be configured.
(40)また、逐次発生データ解析方法は、事前解析する対象とする条件を示す事前解析条件を設定する事前解析条件設定ステップを含み、事前解析制御ステップにおいて、設定された事前解析条件に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行うように構成されていてもよい。 (40) Further, the sequential generation data analysis method includes a pre-analysis condition setting step for setting a pre-analysis condition indicating a condition to be pre-analyzed, and based on the set pre-analysis condition in the pre-analysis control step Further, it may be configured to determine the sequentially generated data to be analyzed in advance and perform control to execute a process of analyzing the sequentially generated data in advance.
(41)また、逐次発生データ解析方法は、事前解析制御ステップにおいて、逐次発生データの発生状況を監視し、逐次発生データの発生状況の監視結果と、設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定し、特定した事前解析対象の逐次発生データの解析を実行させる制御を行い、事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶手段に記憶させるように構成されていてもよい。 (41) Further, the sequential generation data analysis method monitors the generation status of the sequential generation data in the preliminary analysis control step, and based on the monitoring result of the generation status of the sequential generation data and the set preliminary analysis conditions, Specify the sequential data to be pre-analyzed with priority, perform control to execute the sequential data of the specified pre-analysis target, and store the pre-analysis results and pre-analysis results You may comprise so that it may memorize | store in a result memory | storage means.
(42)また、逐次発生データ解析方法は、解析要求の履歴情報を解析要求履歴記憶手段に記憶する解析要求履歴記憶ステップを含み、事前解析制御ステップにおいて、解析要求履歴記憶手段が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定するように構成されていてもよい。 (42) The sequential generation data analysis method includes an analysis request history storage step of storing analysis request history information in the analysis request history storage means, and history information stored in the analysis request history storage means in the prior analysis control step. The priority of the sequentially generated data to be analyzed in advance may be determined so that the sequentially generated data corresponding to the analysis request having a high appearance frequency is preferentially analyzed based on .
(43)また、逐次発生データ解析方法は、逐次発生データの解析にかかった解析コストを監視する解析コスト監視ステップを含み、事前解析制御ステップにおいて、解析コストの監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定するように構成されていてもよい。 (43) The sequential generation data analysis method includes an analysis cost monitoring step for monitoring an analysis cost for analysis of the sequential generation data, and the preliminary analysis target is based on the analysis cost monitoring result in the preliminary analysis control step. It may be configured to determine the priority of the sequentially generated data.
(44)また、逐次発生データ解析方法は、解析コスト監視ステップにおいて、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出し、解析コストの算出結果を解析コスト記憶手段に記憶するように構成されていてもよい。 (44) In the sequential generation data analysis method, in the analysis cost monitoring step, the start time, which is the time at which the analysis of the sequential generation data is started, is temporarily stored. The analysis cost may be calculated based on the end time that is the end time and the temporarily stored start time, and the calculation result of the analysis cost may be stored in the analysis cost storage unit.
(45)また、逐次発生データ解析方法は、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視ステップを含み、事前解析制御ステップにおいて、リソースの監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込むように構成されていてもよい。 (45) Further, the sequential generation data analysis method includes a resource monitoring step of monitoring the free capacity of the resource of the information processing apparatus used for the analysis processing of the sequential generation data, and based on the monitoring result of the resource in the prior analysis control step. The sequential generation data to be analyzed in advance may be narrowed down.
さらに、上記に示した各実施形態では、以下の(46)〜(54)に示すような逐次発生データ解析プログラムの特徴的構成が示されている。 Furthermore, in each embodiment shown above, the characteristic structure of the sequential generation data analysis program as shown to the following (46)-(54) is shown.
(46)逐次発生データ解析プログラムは、コンピュータに、解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御処理を実行させるためのものである。 (46) The sequential generation data analysis program causes a computer to execute a pre-analysis control process for performing a control to execute a pre-analysis process of sequential generation data that is sequentially generated before an analysis request. It is.
(47)また、逐次発生データ解析プログラムは、コンピュータに、解析要求が発生したときに、解析対象の逐次発生データが既に事前解析されているか否かを判定する解析方法判定処理を実行させ、解析方法判定処理において、事前解析されていないと判定すると、解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力する処理と、既に事前解析されていると判定すると、既に事前解析されている解析結果を出力する処理とを実行させるものであってもよい。 (47) The sequential generation data analysis program causes the computer to execute an analysis method determination process for determining whether or not the sequential generation data to be analyzed has already been pre-analyzed when an analysis request is generated. In the method determination process, if it is determined that it has not been pre-analyzed, the control for executing the process of analyzing the sequentially generated data to be analyzed is performed. A process for outputting an analysis result that has already been analyzed in advance may be executed.
(48)また、逐次発生データ解析プログラムは、コンピュータに、事前解析された事前解析結果を事前解析結果記憶手段に記憶させる事前解析結果記憶処理を実行させ、解析方法判定処理において、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が事前解析結果記憶手段に記憶されているか否かを判定することによって、解析対象の逐次発生データが既に事前解析されているか否かを判定する処理を実行させるものであってもよい。 (48) The sequential generation data analysis program causes the computer to execute a pre-analysis result storage process for storing the pre-analysis result pre-analyzed in the pre-analysis result storage means, and an analysis request is generated in the analysis method determination process. Whether or not the sequential analysis data to be analyzed has already been pre-analyzed by determining whether or not the preliminary analysis result corresponding to the sequential generation data to be analyzed is stored in the preliminary analysis result storage means It is also possible to execute a process for determining the above.
(49)また、逐次発生データ解析プログラムは、コンピュータに、事前解析制御処理において、予め設定された、事前解析する対象とする条件を示す事前解析条件に基づいて、事前解析対象とする逐次発生データを判断し、当該逐次発生データを事前解析する処理を実行させる制御を行う処理を実行させるものであってもよい。 (49) Further, the sequential generation data analysis program is configured to sequentially generate data to be pre-analyzed based on a pre-analysis condition that is set in advance in the pre-analysis control process and indicates a condition to be pre-analyzed. May be executed, and a process for performing a control for executing a process of pre-analyzing the sequentially generated data may be executed.
(50)また、逐次発生データ解析プログラムは、コンピュータに、事前解析制御処理において、逐次発生データの発生状況を監視する処理と、逐次発生データの発生状況の監視結果と、設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する処理と、特定した事前解析対象の逐次発生データの解析を実行させる制御を行う処理と、事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶手段に記憶させる処理とを実行させるものであってもよい。 (50) Further, the sequential generation data analysis program causes the computer to monitor the generation status of the sequential generation data, the monitoring result of the generation status of the sequential generation data, and the set pre-analysis condition in the preliminary analysis control processing. Based on the above, the process that specifies the sequential data that should be subject to prior analysis, the process that performs the control to execute the analysis of the sequential data that has been identified, and the analysis result of the prior analysis A process of storing in a pre-analysis result storage unit that stores the pre-analysis result may be executed.
(51)また、逐次発生データ解析プログラムは、コンピュータに、解析要求の履歴情報を解析要求履歴記憶手段に記憶させる解析要求履歴記憶処理を実行させ、事前解析制御処理において、解析要求履歴記憶手段が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する処理を実行させるものであってもよい。 (51) Further, the sequential generation data analysis program causes the computer to execute analysis request history storage processing for storing analysis request history information in the analysis request history storage means. In the prior analysis control processing, the analysis request history storage means Based on the history information to be stored, the processing for determining the priority of the sequentially generated data to be pre-analyzed is performed so that the sequentially generated data corresponding to the analysis request having a high appearance frequency is preferentially analyzed. It may be a thing.
(52)また、逐次発生データ解析プログラムは、コンピュータに、逐次発生データの解析にかかった解析コストを監視する解析コスト監視処理を実行させ、事前解析制御処理において、解析コストの監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する処理を実行させるものであってもよい。 (52) Further, the sequential generation data analysis program causes the computer to execute an analysis cost monitoring process for monitoring an analysis cost for analyzing the sequentially generated data, and based on the analysis cost monitoring result in the prior analysis control process. A process for determining the priority of sequentially generated data to be analyzed in advance may be executed.
(53)また、逐次発生データ解析プログラムは、コンピュータに、解析コスト監視処理において、逐次発生データの解析を開始した時間である開始時間を一時記憶し、逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した開始時間とに基づいて、解析コストを算出する処理と、解析コストの算出結果を解析コスト記憶手段に記憶させる処理とを実行させるものであってもよい。 (53) Further, the sequential generation data analysis program temporarily stores in the computer the start time that is the time when the analysis of the sequential generation data is started in the analysis cost monitoring process, and when the analysis of the sequential generation data is finished, Based on the end time, which is the time when the analysis is finished, and the temporarily stored start time, the processing for calculating the analysis cost and the processing for storing the calculation result of the analysis cost in the analysis cost storage means are executed. There may be.
(54)また、逐次発生データ解析プログラムは、コンピュータに、逐次発生データの解析処理に用いる情報処理装置のリソースの空き容量を監視するリソース監視処理を実行させ、事前解析制御処理において、リソースの監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込む処理を実行させるものであってもよい。 (54) Further, the sequential generation data analysis program causes the computer to execute a resource monitoring process for monitoring the free capacity of the resource of the information processing apparatus used for the analysis process of the sequentially generated data. Based on the result, a process for narrowing down the sequentially generated data to be analyzed in advance may be executed.
以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。 While the present invention has been described with reference to the embodiments, the present invention is not limited to the above embodiments. Various changes that can be understood by those skilled in the art can be made to the configuration and details of the present invention within the scope of the present invention.
この出願は、2009年5月14日に出願された日本特許出願2009−118031を基礎とする優先権を主張し、その開示の全てをここに取り込む。 This application claims the priority on the basis of the JP Patent application 2009-118031 for which it applied on May 14, 2009, and takes in those the indications of all here.
本発明は、サーバが出力するログデータやセンサが出力するデータ等、逐次的に発生するデータを収集して解析することにより、様々なサービスをユーザに提供する装置に適用できる。例えば、本発明は、サービス毎のレスポンスタイムの要望に応じて解析処理を行う逐次発生データ高速解析装置や、方法、プログラムに適用できる。また、本発明は、特に、発生したデータがタイムラグなく解析結果に反映される高速性を要求されるサービスを提供する装置や、方法、プログラムに適用できる。 The present invention can be applied to an apparatus that provides users with various services by collecting and analyzing sequentially generated data such as log data output from a server and data output from a sensor. For example, the present invention can be applied to a sequential data high-speed analysis apparatus, method, and program that perform analysis processing in response to a request for response time for each service. The present invention is particularly applicable to an apparatus, a method, and a program that provide a service that requires high speed in which generated data is reflected in an analysis result without time lag.
1 サービス提供手段
2 サービス要件設定手段
3 解析データ発生手段
4 解析データ記憶手段
5 解析手段
6 解析命令受付手段
7 解析結果記憶手段
8 事前解析制御手段
801 解析対象監視手段
802 事前解析対象生成手段
803 事前解析依頼手段
804 事前解析結果登録手段
805 優先事前解析判定手段
806 空き記憶容量監視手段
9 解析命令履歴手段
10 解析コスト監視手段
1001 解析コスト算出手段
1002 解析コスト記憶手段
101 アプリケーションサーバ
102 解析サーバ
103 データ解析サービスサーバ
104 データ解析受付サーバ
105 データ高速解析サーバDESCRIPTION OF
Claims (15)
ことを特徴とする逐次発生データ解析装置。A sequential data analysis apparatus comprising: a prior analysis control unit that performs control to execute a process of performing prior analysis on sequential generation data that is sequentially generated before an analysis request.
前記解析方法判定手段は、
事前解析されていないと判定すると、前記解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、
既に事前解析されていると判定すると、前記既に事前解析されている解析結果を出力する
請求項1記載の逐次発生データ解析装置。When an analysis request occurs, the analysis method determination means for determining whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control means,
The analysis method determination means includes
If it is determined that it has not been analyzed in advance, it performs control to analyze the sequentially generated data to be analyzed, and outputs the analysis result,
The sequential generation data analysis device according to claim 1, wherein when it is determined that the analysis has already been performed, the analysis result that has already been analyzed in advance is output.
解析方法判定手段は、解析要求が発生したときに、解析対象の逐次発生データに対応する事前解析結果が前記事前解析結果記憶手段に記憶されているか否かを判定することによって、前記解析対象の逐次発生データが既に事前解析されているか否かを判定する
請求項2記載の逐次発生データ解析装置。Pre-analysis result storage means for storing a pre-analysis result pre-analyzed by control by the pre-analysis control means,
The analysis method determination means determines whether the analysis target is generated by determining whether or not a preliminary analysis result corresponding to the sequentially generated data to be analyzed is stored in the preliminary analysis result storage means when an analysis request is generated. The sequential generation data analysis apparatus according to claim 2, wherein it is determined whether or not the sequential generation data has been previously analyzed.
請求項1から請求項3のうちのいずれか1項に記載の逐次発生データ解析装置。The pre-analysis control unit is configured to determine a sequential generation data to be pre-analyzed based on the preset pre-analysis condition indicating a condition to be pre-analyzed, and to pre-analyze the sequential generation data The sequential generation data analysis device according to any one of claims 1 to 3, wherein control is performed to execute the control.
逐次発生データの発生状況を監視する逐次発生データ監視手段と、
前記逐次発生データ監視手段の監視結果と、事前解析条件設定手段によって設定された事前解析条件とに基づいて、優先して事前解析の対象とすべき逐次発生データを特定する事前解析対象特定手段と、
前記事前解析対象特定手段が特定した事前解析対象の逐次発生データの解析を実行させる制御を行う事前解析実行制御手段と、
前記事前解析実行制御手段の制御により実行された事前解析の解析結果を、事前解析結果を記憶する事前解析結果記憶手段に記憶させる事前解析結果登録手段とを含む
請求項1から請求項4のうちのいずれか1項に記載の逐次発生データ解析装置。The pre-analysis control means is
Sequentially generated data monitoring means for monitoring the occurrence status of sequentially generated data;
Based on the monitoring result of the sequential generation data monitoring unit and the preanalysis condition set by the preanalysis condition setting unit, a preanalysis target specifying unit that specifies sequential generation data to be preferentially analyzed, ,
Pre-analysis execution control means for performing control to execute analysis of sequentially generated data of the pre-analysis target specified by the pre-analysis target specifying means;
The pre-analysis result registration means for storing the analysis result of the pre-analysis executed by the control of the pre-analysis execution control means in the pre-analysis result storage means for storing the pre-analysis result. The sequential generation data analysis apparatus according to any one of the above.
事前解析制御手段は、前記解析要求履歴記憶手段が記憶する履歴情報に基づいて、出現頻度が高い解析要求に対応する逐次発生データを優先して事前解析対象とするように、事前解析対象とする逐次発生データの優先度を判定する出現頻度優先事前解析判定手段を含む
請求項1から請求項5のうちのいずれか1項に記載の逐次発生データ解析装置。An analysis request history storage means for storing analysis request history information is provided,
Based on the history information stored in the analysis request history storage unit, the pre-analysis control unit sets the pre-analysis target so that sequential generation data corresponding to an analysis request with a high appearance frequency is preferentially analyzed. The sequential generation data analysis device according to any one of claims 1 to 5, further comprising an appearance frequency priority preliminary analysis determination unit that determines the priority of the sequential generation data.
事前解析制御手段は、前記解析コスト監視手段の監視結果に基づいて、事前解析対象とする逐次発生データの優先度を判定する解析コスト優先事前解析判定手段を含む
請求項1から請求項6のうちのいずれか1項に記載の逐次発生データ解析装置。With analysis cost monitoring means to monitor the analysis cost for analyzing the sequentially generated data,
The pre-analysis control unit includes an analysis cost priority pre-analysis determination unit that determines the priority of sequentially generated data to be pre-analyzed based on a monitoring result of the analysis cost monitoring unit. The sequential generation data analysis device according to any one of the above.
逐次発生データの解析を開始した時間である開始時間を一時記憶し、前記逐次発生データの解析を終了したときに、当該解析を終了した時間である終了時間と、一時記憶した前記開始時間とに基づいて、解析コストを算出する解析コスト算出手段と、
前記解析コスト算出手段の算出結果を記憶する解析コスト記憶手段とを含む
請求項7記載の逐次発生データ解析装置。Analysis cost monitoring means
Temporarily storing a start time, which is a time when analysis of sequentially generated data is started, and when analysis of the sequentially generated data is finished, an end time, which is a time when the analysis is ended, and the temporarily stored start time Analysis cost calculation means for calculating the analysis cost based on
The sequential generation data analysis device according to claim 7, further comprising an analysis cost storage unit that stores a calculation result of the analysis cost calculation unit.
事前解析制御手段は、前記リソース監視手段の監視結果に基づいて、事前解析する対象とする逐次発生データを絞り込む
請求項1から請求項8のうちのいずれか1項に記載の逐次発生データ解析装置。Resource monitoring means for monitoring the free capacity of the resources of the information processing device used for analysis processing of sequentially generated data,
The sequential analysis data analysis device according to any one of claims 1 to 8, wherein the preliminary analysis control unit narrows down the sequential generation data to be analyzed in advance based on a monitoring result of the resource monitoring unit. .
前記データ発生手段が発生する前記逐次発生データの解析処理を実行する逐次発生データ解析装置と、
前記逐次発生データ解析装置の解析結果に基づいて、データ解析サービスを提供する処理を実行するサービス提供装置とを備え、
前記逐次発生データ解析装置は、解析要求よりも前に、前記逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御手段を含む
ことを特徴とする逐次発生データ解析システム。A data generator for generating sequentially generated data which is sequentially generated data;
A sequential data analysis device for performing an analysis process of the sequential data generated by the data generation means;
A service providing device that executes a process of providing a data analysis service based on the analysis result of the sequential data analysis device;
The sequential generation data analysis system includes a prior analysis control unit that performs control to execute a process of performing preliminary analysis of the sequential generation data before an analysis request.
前記解析方法判定手段は、
事前解析されていないと判定すると、前記解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、
既に事前解析されていると判定すると、前記既に事前解析されている解析結果を出力する
請求項10記載の逐次発生データ解析システム。The sequential generation data analysis device includes an analysis method determination unit that determines whether or not the sequential generation data to be analyzed has already been pre-analyzed by control by the pre-analysis control unit when an analysis request is generated,
The analysis method determination means includes
If it is determined that it has not been analyzed in advance, it performs control to analyze the sequentially generated data to be analyzed, and outputs the analysis result,
The sequential generation data analysis system according to claim 10, wherein when it is determined that the analysis is already performed in advance, the analysis result that has been analyzed in advance is output.
ことを特徴とする逐次発生データ解析方法。A sequential data analysis method comprising a pre-analysis control step for performing a control to execute a process of pre-analyzing sequentially generated data that is sequentially generated before an analysis request.
前記解析方法判定ステップにおいて、
事前解析されていないと判定すると、前記解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力し、
既に事前解析されていると判定すると、前記既に事前解析されている解析結果を出力する
請求項12記載の逐次発生データ解析方法。An analysis method determination step for determining whether or not the sequential generation data to be analyzed has already been pre-analyzed when an analysis request occurs,
In the analysis method determination step,
If it is determined that it has not been analyzed in advance, it performs control to analyze the sequentially generated data to be analyzed, and outputs the analysis result,
The sequential generation data analysis method according to claim 12, wherein when it is determined that the analysis has been performed in advance, the analysis result that has been analyzed in advance is output.
解析要求よりも前に、逐次発生するデータである逐次発生データを事前解析する処理を実行させる制御を行う事前解析制御処理を
実行させるための逐次発生データ解析プログラム。On the computer,
A sequential generation data analysis program for executing a pre-analysis control process for performing a control for executing a process for performing a pre-analysis of sequential generation data that is sequentially generated before an analysis request.
解析要求が発生したときに、解析対象の逐次発生データが既に事前解析されているか否かを判定する解析方法判定処理を実行させ、
前記解析方法判定処理において、
事前解析されていないと判定すると、前記解析対象の逐次発生データを解析する処理を実行する制御を行い、当該解析結果を出力する処理と、
既に事前解析されていると判定すると、前記既に事前解析されている解析結果を出力する処理とを実行させる
請求項14記載の逐次発生データ解析プログラム。On the computer,
When an analysis request occurs, the analysis method determination process is executed to determine whether the sequential generation data to be analyzed has already been analyzed in advance.
In the analysis method determination process,
When it is determined that the analysis is not performed in advance, the process of analyzing the sequential generation data of the analysis target is performed, and the process of outputting the analysis result;
The sequential generation data analysis program according to claim 14, wherein when it is determined that the analysis has been performed in advance, the processing for outputting the analysis result that has already been analyzed in advance is executed.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009118031 | 2009-05-14 | ||
JP2009118031 | 2009-05-14 | ||
PCT/JP2010/002904 WO2010131425A1 (en) | 2009-05-14 | 2010-04-22 | Sequentially generated data analysis device, system, method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JPWO2010131425A1 true JPWO2010131425A1 (en) | 2012-11-01 |
Family
ID=43084811
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011513230A Pending JPWO2010131425A1 (en) | 2009-05-14 | 2010-04-22 | Sequentially generated data analysis apparatus, system, method, and program |
Country Status (2)
Country | Link |
---|---|
JP (1) | JPWO2010131425A1 (en) |
WO (1) | WO2010131425A1 (en) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5797966B2 (en) * | 2011-07-27 | 2015-10-21 | イクス株式会社 | Information processing apparatus, information processing method, and program |
US9015289B2 (en) | 2012-04-12 | 2015-04-21 | Netflix, Inc. | Method and system for evaluating the resiliency of a distributed computing service by inducing a latency |
JP6617856B1 (en) * | 2018-05-14 | 2019-12-11 | 富士通株式会社 | Analysis program, analysis method, and analysis apparatus |
CN116866203A (en) * | 2022-03-28 | 2023-10-10 | 中国移动通信有限公司研究院 | Information acquisition method and device, network equipment and terminal |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2000057155A (en) * | 1998-08-07 | 2000-02-25 | Mitsubishi Electric Corp | Information retrieval device |
JP3744255B2 (en) * | 1999-04-27 | 2006-02-08 | 日本電信電話株式会社 | Access analysis method and apparatus, and storage medium storing access analysis program |
JP2001249947A (en) * | 2000-03-06 | 2001-09-14 | Nippon Telegr & Teleph Corp <Ntt> | Document search method and apparatus, and recording medium storing document search program |
JP2004252971A (en) * | 2003-01-30 | 2004-09-09 | Daiwa Securities Group Inc | Company information providing system, method and program, and client system control method |
JP2005316846A (en) * | 2004-04-30 | 2005-11-10 | Fuji Xerox Co Ltd | File management system, method and program |
JP2007034652A (en) * | 2005-07-27 | 2007-02-08 | Hitachi Software Eng Co Ltd | Link destination access state display system |
JP4071816B1 (en) * | 2007-03-22 | 2008-04-02 | 透 降矢 | Database query processing system using multi-operation processing using synthetic relational operations |
-
2010
- 2010-04-22 JP JP2011513230A patent/JPWO2010131425A1/en active Pending
- 2010-04-22 WO PCT/JP2010/002904 patent/WO2010131425A1/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
WO2010131425A1 (en) | 2010-11-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US10332009B2 (en) | Predicting user navigation events | |
US10896285B2 (en) | Predicting user navigation events | |
US10089579B1 (en) | Predicting user navigation events | |
AU2018201459B2 (en) | System and method for improving access to search results | |
US8862529B1 (en) | Predicting user navigation events in a browser using directed graphs | |
US7818289B2 (en) | Network control system, network control method, and computer product | |
JP4868245B2 (en) | SEARCH SYSTEM, SEARCH DEVICE, AND SEARCH METHOD | |
US8135733B2 (en) | Information retrieval apparatus, information retrieval method and information retrieval processing program | |
WO2010131425A1 (en) | Sequentially generated data analysis device, system, method, and program | |
JP3183236B2 (en) | Search system and computer-readable recording medium storing program for generating search system | |
JP2011210196A (en) | Server device, evaluation method and evaluation program | |
JP3248530B2 (en) | Search system and computer-readable recording medium storing program for generating search system | |
JP5663742B2 (en) | Image search server and image information management method for image search server | |
US20070136084A1 (en) | Article distribution system and article distribution method used in this system | |
JP5222691B2 (en) | Search information provision system | |
JP2006235820A (en) | Distribution technology for bookmark information | |
KR20140052249A (en) | A service method for various web sources related to technology information, and system thereof | |
JP2004302982A (en) | Document management system | |
JP2006085282A (en) | Content search system |