JP2011141777A - Apparatus, method and program for data summarization - Google Patents
Apparatus, method and program for data summarization Download PDFInfo
- Publication number
- JP2011141777A JP2011141777A JP2010002488A JP2010002488A JP2011141777A JP 2011141777 A JP2011141777 A JP 2011141777A JP 2010002488 A JP2010002488 A JP 2010002488A JP 2010002488 A JP2010002488 A JP 2010002488A JP 2011141777 A JP2011141777 A JP 2011141777A
- Authority
- JP
- Japan
- Prior art keywords
- approximate expression
- representative
- data
- approximate
- storage means
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims description 51
- 230000014509 gene expression Effects 0.000 claims description 675
- 238000012544 monitoring process Methods 0.000 claims description 30
- 238000007726 management method Methods 0.000 description 44
- 230000006870 function Effects 0.000 description 27
- 238000004364 calculation method Methods 0.000 description 25
- 238000012545 processing Methods 0.000 description 17
- 238000010586 diagram Methods 0.000 description 16
- 238000013500 data storage Methods 0.000 description 13
- 238000012886 linear function Methods 0.000 description 13
- 230000010365 information processing Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 6
- 230000004913 activation Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000001174 ascending effect Effects 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は、逐次的に発生するデータを逐次的に近似により要約して情報量を削減するデータ要約装置、データ要約方法、及びデータ要約プログラムに関する。 The present invention relates to a data summarization apparatus, a data summarization method, and a data summarization program that reduce the amount of information by sequentially summarizing sequentially generated data by approximation.
時系列データの値を複数の近似式により表して近似する技術が提案されている。例えば、特許文献1には、学習用データに基づいて、その学習用データを近似する関数を作成する関連技術が記載されている。
There has been proposed a technique for approximating the value of time series data by representing it by a plurality of approximation formulas. For example,
特許文献1に記載された関連技術では、学習用のデータをまずクラスタリングし、次に各クラスタに対してそのクラスタのデータを表す近似式を作成し、各クラスタの近似式の誤差を評価する。そして、近似式の誤差が大きなクラスタに対しては再帰的にクラスタリング、近似式作成、及び評価を行う。また、クラスタの情報と各近似式とはそれぞれ記憶され、入力データはまず所属クラスタを判定され、そのクラスタの近似式を用いて入力データの近似値が計算される。
In the related technique described in
また、例えば、特許文献2には、関連する技術として、プラントデータを近似式を用いて近似し保存するデータ圧縮保存装置が記載されている。また、特許文献2に記載された関連技術では、近似式により予想される値と実際の入力データの値との偏差を求め、求めた偏差が所定の閾値より大きい場合にはその入力データを保存すると判断して保存し、所定の閾値より小さい場合にはデータ保存の必要がないと判断することが記載されている。
For example,
特許文献1に記載された関連技術では、精度が一定以上になるまでクラスタリングと近似式の作成とを再帰的に繰り返す。そのため、逐次的に発生し値が突発的に変化するデータを近似する場合には、クラスタと近似式の個数とが増加し続ける。すると、連続的に発生する時系列データを近似式で近似するデータ要約装置に特許文献1に記載された関連技術を適用し、長期間にわたり連続的に発生するデータを逐次的に扱い続けると、データ発生毎に行われるクラスタの判定の計算量が増加し続けることなる。そして、データが発生する毎の計算量が増加し続けてデータ要約装置の処理速度を越えてしまうと、近似式によるデータの近似が行えなくなる。
In the related technique described in
従って、特許文献1に記載された関連技術を用いても、逐次的に発生するデータの値が突発的に変化する場合には、データの要約の対象となる期間が長くなると、データの要約を続けることが難しくなる。
Therefore, even if the related technique described in
なお、逐次的に発生するデータであって、データ値が突発的に大きく変化するデータの一例として、CPUの使用率等が挙げられる。このように、データ値が不規則に突然大きく変化するデータの圧縮を行う場合には、特許文献1に記載された関連技術は適さない。
An example of data that is sequentially generated and whose data value changes suddenly is a CPU usage rate. As described above, the related art described in
また、特許文献2に記載された関連技術を用いれば、実際の入力データの値が近似式で予想される値からどの程度離れているか否かを判別して保存対象のデータを選別することによって、データ保存を効率的に行っている。しかし、入力データの近似を1つの近似式のみを用いて行っており、入力データの値の変化傾向がある程度一定である場合にしか適さない。従って、特許文献2に記載された関連技術を用いて、突発的に変化するデータを近似することはできない。
In addition, by using the related technique described in
そこで、本発明は、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができるデータ要約装置、データ要約方法、及びデータ要約プログラムを提供することを目的とする。 Therefore, the present invention provides a data summarization apparatus, a data summarization method, and data capable of continuing data summarization even when the data summarization period is long when the data value suddenly changes. The purpose is to provide a summary program.
本発明によるデータ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。 A data summarization device according to the present invention is a data summarization device for summarizing sequentially generated data, and is used for approximating newly generated data and all approximation formula storage means for storing a plurality of approximation formulas for approximating data. As a representative approximate expression that is a candidate for, the approximate value obtained using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a range of values that the data can take And a representative approximate expression selecting means for selecting an approximate expression included in the range and a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
本発明によるデータ要約装置の他の態様は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。 Another aspect of the data summarization device according to the present invention is a data summarization device for summarizing sequentially generated data, all approximate expression storage means for storing a plurality of approximate expressions for approximating data, and newly generated data As an approximate expression that is a candidate for approximating, an approximate value obtained by using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a value that can be taken by the data. A representative approximate expression selecting means for selecting an approximate expression within a predetermined range and within a predetermined number, and a representative approximate expression for storing the representative approximate expression selected by the representative approximate expression selecting means And a storage means.
本発明によるデータ要約装置のさらに他の態様は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。 Still another aspect of the data summarizing device according to the present invention is a data summarizing device for summarizing sequentially generated data, a total approximation formula storing means for storing a plurality of approximation formulas for approximating data, and a newly generated data summarization device. Representative approximate expression selection means for selecting an approximate expression within a predetermined number from among a plurality of approximate expressions stored in all approximate expression storage means as representative approximate expressions that are candidates for approximating data, and representative And a representative approximate expression storing means for storing the representative approximate expression selected by the approximate expression selecting means.
本発明によるデータ要約方法は、逐次発生するデータを要約するデータ要約方法であって、データを近似するための近似式を全近似式記憶手段に複数記憶し、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択し、選択した代表近似式を代表近似式記憶手段に記憶することを特徴とする。 A data summarization method according to the present invention is a data summarization method for summarizing sequentially generated data, in which a plurality of approximation formulas for approximating data are stored in a total approximation formula storage means, and newly generated data is approximated. As a representative approximate expression that is a candidate for, the approximate value obtained using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a range of values that the data can take And an approximate expression within a predetermined number is selected, and the selected representative approximate expression is stored in the representative approximate expression storage means.
本発明によるデータ要約プログラムは、逐次発生するデータを要約するためのデータ要約プログラムであって、データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、選択した代表近似式を代表近似式記憶手段に記憶させる処理とを実行させるためのものである。 A data summarization program according to the present invention is a data summarization program for summarizing sequentially generated data, and is newly generated in a computer having all approximate expression storage means for storing a plurality of approximate expressions for approximating data. As a representative approximate expression that is a candidate for approximating the obtained data, the approximate value obtained using each approximate expression based on the current time can be taken from the approximate expression stored in the all approximate expression storage means. A process of selecting an approximate expression that is included in a value range that is a range of values and that is within a predetermined number, and a process of storing the selected representative approximate expression in the representative approximate expression storage unit are executed. Is for.
本発明によれば、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。 According to the present invention, when the value of data suddenly changes, data summarization can be continued even if the period for which data summarization is performed becomes longer.
以下、本発明の実施形態を図面を参照して説明する。まず最初に、本発明によるデータ要約装置全体の概略を説明する。本発明によるデータ要約装置は、時間経過に沿って逐次的に発生するデータの情報量を削減する。情報量を削減することにより、データ自体をそのまま正確に記憶する場合に比べて、データを記憶するために必要となる記憶容量を抑えることができる。本実施形態では、このようにデータの情報量を削減することを「要約」という。 Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, an outline of the entire data summarizing apparatus according to the present invention will be described. The data summarization apparatus according to the present invention reduces the amount of data that is sequentially generated over time. By reducing the amount of information, it is possible to reduce the storage capacity required for storing data, compared to the case where the data itself is stored exactly as it is. In the present embodiment, reducing the amount of data information in this way is referred to as “summary”.
一般に、要約によってデータの精度は低下するが、本発明によるデータ要約装置は、時間経過に沿って逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータを、精度よく、効率的に要約する。 In general, although the accuracy of data is reduced by summarization, the data summarization device according to the present invention is data that is generated with a constant tendency sequentially over time, and the tendency of the data may change irregularly. Summarize certain data accurately and efficiently.
逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータの例として、例えば、「CPUの使用率」が挙げられる。なお、CPUの使用率に限らず、例えば、観測対象とするWebページの単位時間当たりのアクセス数や、Webページ公開後からの総アクセス数等の情報も、突発的に値が変化するので、「逐次的に一定の傾向で発生するデータであって、不規則に変化することがあるデータ」に該当する。また、例えば、ネットワーク機器の通信量等も「逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータ」に該当する。なお、「逐次的に発生するデータ」は、「逐次的に観測可能なデータ」も含む概念である。 For example, “CPU usage rate” is an example of data that is generated sequentially with a certain tendency and the tendency of the data may change irregularly. In addition, not only the CPU usage rate, but also the information such as the number of accesses per unit time of the web page to be observed, the total number of accesses after the web page has been released, etc. suddenly change, so This corresponds to “data that occurs sequentially with a certain tendency and may change irregularly”. In addition, for example, the communication amount of the network device also corresponds to “data that is sequentially generated in a certain tendency and the data tendency may change irregularly”. “Sequentially generated data” is a concept including “sequentially observable data”.
「逐次的に一定の傾向で発生するデータであって、不規則に変化することがあるデータ」として、以下の説明では、時間経過とともに発生する数値を例にして説明する。ただし、データ自体が数値でなくても、数値化可能であり、数値化したデータ同士の差分を導出できるデータであればよい。 In the following description, numerical values that occur over time will be described as an example as “data that is generated sequentially with a certain tendency and may change irregularly”. However, even if the data itself is not a numerical value, it can be converted into a numerical value, and any data can be used as long as the difference between the converted data can be derived.
なお、以下に示す例では、各データは、データ値と、そのデータ値の発生時刻とを対応付けて含む。以下の説明において、このデータ値の発生時刻を、単にデータの発生時刻と呼ぶ場合がある。 In the example shown below, each data includes a data value and an occurrence time of the data value in association with each other. In the following description, the occurrence time of this data value may be simply referred to as the occurrence time of data.
なお、以下の説明では、時系列に逐次的に発生するデータを用いる場合を示しているが、何らかの順序性をもつデータであれば、例えば、距離が近い順や遠い順等の位置的な順序性をもったデータを逐次的に入力して解析を行う場合にも適用できる。また、短い時間間隔(例えば、数秒間隔)で連続して発生されるデータに限らず、逐次的に発生するデータであれば、例えば、数時間や数日等の長い時間間隔で発生するデータや、発生間隔が一定しないようなデータを扱う場合にも適用できる。 In the following description, the case where data that occurs sequentially in time series is used is shown. However, if the data has some order, for example, the positional order such as the order of distance or the order of distance It can also be applied to the case of performing analysis by sequentially inputting characteristic data. Further, the data is not limited to data generated continuously at short time intervals (for example, every few seconds), but may be data generated at long time intervals such as several hours or days as long as the data is generated sequentially. It can also be applied to the case of handling data whose occurrence interval is not constant.
また、本発明によるデータ要約装置は、発生したデータの集合に基づいて、発生時刻を変数とし、データ値(数値)を算出するための関数を導出する。この関数は、発生時刻に基づいてデータ値の近似値を求めるための近似式である。 In addition, the data summarization apparatus according to the present invention derives a function for calculating a data value (numerical value) based on a set of generated data, with the generation time as a variable. This function is an approximate expression for obtaining an approximate value of a data value based on the occurrence time.
(第1の実施形態)
次に、本発明の第1の実施形態を図面を参照して説明する。図1は、本発明によるデータ要約装置の構成例を示すブロック図である。図1に示すように、本実施形態は、データ要約装置は、代表近似式管理部1と、全近似式記憶手段2と、代表近似式記憶手段3と、データ入力手段91と、近似手段92とを含む。なお、データ要約装置は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。
(First embodiment)
Next, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a data summarization apparatus according to the present invention. As shown in FIG. 1, in this embodiment, the data summarizing apparatus includes a representative approximate
全近似式記憶手段2は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。全近似式記憶手段2は、過去のデータの値(近似値)を求めるための全ての近似式を、それぞれの近似式を識別するためのIDとともに対応付けて記憶する。例えば、過去のデータの値が1次元の実数で表され、データの値を当該データの発生時刻についての1次関数により近似する場合、全近似式記憶手段2は、近似式のID、1次関数の係数、及び定数項を対応付けて記憶すればよい。なお、このような情報の例は一例であり、全近似式記憶手段2が記憶する情報は、これらに限るものではない。
Specifically, the total
図2は、全近似式記憶手段2が記憶する近似式を表すデータの一例を示す説明図である。図2に示す例では、データの値xが当該データ発生時刻tの1次関数x=at+bにより近似される場合を示している。図2に示す例では、全近似式記憶手段2は、各近似式として、ID(T20)と、1次関数の係数(T21)と、定数項(T22)とを対応付けた組を記憶している。なお、以下、1次関数の係数(T21)のことを単に1次係数ともいう。
FIG. 2 is an explanatory diagram showing an example of data representing the approximate expression stored in the all approximate expression storage means 2. As shown in FIG. The example shown in FIG. 2 shows a case where the data value x is approximated by a linear function x = at + b of the data generation time t. In the example shown in FIG. 2, the total approximate
図2において、ID(T20)は、過去のデータの値を近似するための1次関数を識別するための識別子である。1次係数(T21)は、1次関数x=at+bにおける時刻tに関する1次の係数(1次関数における傾きの値)である。定数項(T22)は、1次関数の定数項(1次関数における切片の値)である。 In FIG. 2, ID (T20) is an identifier for identifying a linear function for approximating past data values. The linear coefficient (T21) is a linear coefficient (the slope value in the linear function) related to the time t in the linear function x = at + b. The constant term (T22) is a constant term of the linear function (intercept value in the linear function).
代表近似式管理部1は、具体的には、プログラムに従って動作する情報処理装置のCPU、及び磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。代表近似式管理部1は、全近似式記憶手段2に記憶されている全ての近似式の中から、予め定められた個数以内の近似式を選出する機能を備える。また、代表近似式管理部1は、選出した近似式を代表近似式記憶手段3に出力して、代表近似式記憶手段3に近似式を記憶させる機能を備える。なお、代表近似式管理部1により選出された近似式を、以下、代表近似式と呼ぶ。
Specifically, the representative approximate
図3は、代表近似式管理部1の構成例を示すブロック図である。本実施形態では、代表近似式管理部1は、図3に示すように、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13とを含む。
FIG. 3 is a block diagram illustrating a configuration example of the representative approximate
値域記憶手段12は、データ入力手段91が入力するデータの値がとりうる範囲(値域)を記憶する。例えば、データ要約装置が要約対象とするデータがCPUの使用率[%]である場合には、入力データの値は0以上100以下の実数(すなわち[0,100]={x|0≦x≦100})となる筈である。この場合、値域記憶手段12は、入力データがとりうる最小の値と最大の値とである0と100とを記憶する。なお、このような情報の例は一例であり、値域記憶手段12が記憶する情報は、これに限るものではない。
The value
図4は、値域記憶手段12が記憶する値域を表すデータの一例を示す説明図である。図4に示す例では、データの値域が[0, 10]である場合が示されており、値域記憶手段12は、値域の最大値T121と最小値T122とを記憶している。
FIG. 4 is an explanatory diagram illustrating an example of data representing a range stored by the
代表近似式第1限定手段11は、全近似式記憶手段2が記憶する過去のデータを表す全ての近似式の中から、代表近似式の候補として、現在時刻における値が値域に属しているもののみを抽出して代表近似式第2限定手段13に出力する機能を備える。
The representative approximation formula first limiting
代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式fi (i=1,2,.., n)を入力として受け取る(入力する)。また、代表近似式第1限定手段11は、入力した各近似式fiを用いて、現在時刻tnow における近似値fi(tnow)を求める。そして、代表近似式第1限定手段11は、全近似式記憶手段2が記憶する近似式のうち、求めた現在時刻tnow における値fi(tnow)が値域Vに属しているfiのみを選択して、代表近似式第2限定手段13に出力する。
The representative approximate expression first limiting
なお、代表近似式第1限定手段11は、予め定めた一定時間毎に、全近似式記憶手段2から近似式を読み込んで、現在時刻における近似値が値域に属する近似式を選択する処理を行ってもよい。あるいは、代表近似式第1限定手段11は、ユーザ等の操作に従って、代表近似式を更新したい任意のタイミングで起動指示を入力して、全近似式記憶手段2から近似式を読み込んで、現在時刻における近似値が値域に属する近似式を選択する処理を行ってもよい。
The representative approximate expression first limiting
代表近似式第2限定手段13は、代表近似式第1限定手段11が出力した近似式を入力として受け取り(入力し)、その中から予め定められた個数以下の近似式を選出する機能を備える。また、代表近似式第2限定手段13は、選出(選択)した近似式を代表近似式記憶手段3に出力、代表近似式記憶手段3に近似式を記憶させる機能を備える。
The representative approximate expression second limiting
代表近似式第2限定手段13は、例えば、代表近似式第1限定手段11からの近似式のうち、所定個数の近似式を、近似式のIDの降順(すなわち、IDの値が大きい順)に選出(選択)すればよい。近似式IDが昇順に付与されている場合、IDの降順に選出すると、代表近似式第2限定手段13は、近似式の決定された時刻が新しい順に、予め定められた個数の近似式を選択して出力することができる。なお、そのような近似式の選択方法は一例であり、代表近似式第2限定手段13が近似式を選択する方法は、このような方法に限るものではない。例えば、逆に、近似式IDが降順に付与されている場合には、代表近似式第2限定手段13は、IDの昇順に近似式を選択するようにしてもよい。
For example, the representative approximation formula second limiting
代表近似式記憶手段3は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。代表近似式記憶手段3は、代表近似式管理部1が選出した予め定められた最大個数N個の代表近似式を記憶する。なお、代表近似式記憶手段3は、例えば、全近似式記憶手段2が記憶するデータと同様のデータ形式でデータを記憶しても構わない。例えば、近似式が時刻tの1次関数で表わされている場合、代表近似式記憶手段3は、近似式のID、1次関数の係数、及び定数項を対応付けて記憶すればよい。また、代表近似式記憶手段3は、例えば、近似式のIDのみを記憶しても構わない。なお、このような情報の例は一例であり、代表近似式記憶手段3が記憶する情報は、これらに限るものではない。
Specifically, the representative approximate
図5は、代表近似式記憶手段3が記憶する代表近似式を表すデータの一例を示す説明図である。図5に示す例では、データの値xが時刻の1次関数x=at+bで近似される場合を示している。図5に示す例では、代表近似式記憶手段3は、各近似式として、ID(T30)と、1次関数の係数(T31)と、定数項(T32)とを対応付けた組を記憶している。
FIG. 5 is an explanatory diagram showing an example of data representing the representative approximate expression stored in the representative approximate expression storage means 3. The example shown in FIG. 5 shows a case where the data value x is approximated by a linear function x = at + b of time. In the example shown in FIG. 5, the representative approximate
データ入力手段91は、具体的には、プログラムに従って動作する情報処理装置のCPU及び入力インタフェース部によって実現される。データ入力手段91は、時間経過にともなって逐次データを発生するデータ発生源からデータを取得(入力)する機能を備える。なお、データ発生源は、データの種類により異なる。例えば、CPU使用率を入力データとする場合には、CPU使用率を監視するユニットをデータ発生源としてもよい。また、例えば、Webページのアクセス数を入力データとする場合には、Webサーバをデータ発生源としてもよい。データ入力手段91は、データ発生源から、個々のデータとして、少なくとも、データ値と、そのデータ値の発生時刻とを対応付けて含むデータを入力する。 Specifically, the data input means 91 is realized by a CPU and an input interface unit of an information processing apparatus that operates according to a program. The data input means 91 has a function of acquiring (inputting) data from a data generation source that sequentially generates data over time. The data generation source varies depending on the type of data. For example, when the CPU usage rate is used as input data, a unit that monitors the CPU usage rate may be used as a data generation source. For example, when the number of accesses to a web page is used as input data, a web server may be used as a data generation source. The data input means 91 inputs data including at least a data value and an occurrence time of the data value as individual data from the data generation source.
近似手段92は、具体的には、プログラムに従って動作する情報処理装置のCPU、及び磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。近似手段92は、データ入力手段91が取得(入力)したデータと、代表近似式記憶手段3が記憶する近似式とを入力として受け取る(入力する)機能を備える。また、近似手段92は、代表近似式記憶手段3から入力した近似式の中で十分小さい誤差でデータ入力手段91から入力したデータを表せるものが存在すれば、その近似式により入力データを近似する機能を備える。また、近似手段92は、十分小さい誤差の近似式が存在しなければ、新たな近似式を作成して全近似式記憶手段2に出力し、新たに作成した近似式を全近似式記憶手段2に記憶させる機能を備える。なお、近似手段92は、データ入力手段91からデータが入力される度に動作し、近似式を用いて入力データを近似する処理や近似式を生成する処理を実行する。
Specifically, the approximating means 92 is realized by a CPU of an information processing device that operates according to a program and a storage device such as a magnetic disk device or an optical disk device. The approximating means 92 has a function of receiving (inputting) the data acquired (input) by the data input means 91 and the approximate expression stored in the representative approximate expression storage means 3 as inputs. Further, the approximation means 92 approximates the input data by the approximate expression if there is an approximate expression input from the representative approximate expression storage means 3 that can represent the data input from the data input means 91 with a sufficiently small error. It has a function. Further, if there is no sufficiently small error approximate expression, the approximating means 92 creates a new approximate expression and outputs it to the all approximate expression storing means 2, and the newly created approximate expression is stored in the all approximate expression storing means 2 The function to memorize is provided. The approximating
図6は、近似手段92の構成の一例を示すブロック図である。図6に示す例では、近似手段92は、近似式計算手段921と、出力手段922と、未確定データ記憶手段923と、新規近似式生成手段924とを含む。
FIG. 6 is a block diagram showing an example of the configuration of the approximating means 92. As shown in FIG. In the example shown in FIG. 6, the approximating
近似式計算手段921は、代表近似式記憶手段3に記憶された近似式に対して、データ入力手段91から入力したデータ値の発生時刻に対応する値(近似値)を計算する機能を備える。すなわち、近似式計算手段921は、発生時刻の値を近似式に代入して、仮にその近似式を用いて入力データ値を近似した場合の近似値を求める。また、近似式計算手段921は、その求めた近似式に対する値とデータ入力手段91から入力したデータ値とに基づいて、入力したデータの近似値計算に適する近似式を選択する機能を備える。すなわち、例えば、近似式計算手段921は、近似式を用いて求めた近似値と、データ入力手段91から入力した実データとの値の誤差を求め、誤差が所定の許容値以内で且つ最も誤差の小さい近似式を最適な近似式として選択する。そして、近似式計算手段921は、選択した近似式とデータ値の発生時刻とを出力手段922に出力する機能を備える。
The approximate
一方、適する近似式がなければ(例えば、誤差が所定の許容値以内の近似式がなければ)、近似式計算手段921は、未確定データ記憶手段923に、データ入力手段91から入力したデータ値をそのまま出力して記憶させる。 On the other hand, if there is no suitable approximation formula (for example, if there is no approximation formula with an error within a predetermined allowable value), the approximate formula calculation means 921 sends the data value input from the data input means 91 to the undefined data storage means 923. Is output and stored as it is.
例えば、近似式計算手段921は、代表近似式記憶手段3に記憶された各近似式に対して、データ入力手段91から入力したデータの発生時刻を代入して計算した各近似値と、入力したデータの実際のデータ値とを比較する。そして、近似式計算手段921は、予め定められた精度を満たす近似式のうち、予め定められた条件に従って1つの近似式を特定する。
For example, the approximate expression calculation means 921 inputs each approximate value calculated by substituting the generation time of the data input from the data input means 91 for each approximate expression stored in the representative approximate expression storage means 3. Compare the actual data value of the data. Then, the approximate
なお、近似式の特定方法は任意であり、例えば、近似式計算手段921は、予め定められた精度を満たす近似式のうち、精度が最も良い近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してもよい。あるいは、近似式計算手段921は、例えば、入力したデータを表わす近似式として選んだ際に、データ要約装置の記憶手段(例えば、磁気ディスク装置や光ディスク装置)で使用する記憶容量合計の増加が最小となる近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してもよい。
Note that the method of specifying the approximate expression is arbitrary. For example, the approximate
あるいは、近似式計算手段921は、例えば、時刻を代入した際の値の計算量が最小となる近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してよい。また、近似式計算手段921は、例えば、近似式を生成した時刻が最も新しい近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してよい。
Alternatively, the approximate
なお、上記に示した近似式の特定方法は一例に過ぎず、近似式計算手段921が近似式を特定する方法は、これらに限るものではない。
Note that the approximate expression specifying method described above is merely an example, and the method by which the approximate
一方、近似式計算手段921は、予め定められた精度を満たす近似式の中から1つの近似式を特定できない場合もある。すなわち、近似式計算手段921は、予め定められた精度を満たす近似式が代表近似式記憶手段3に存在しない場合、1つの近似式を特定することができない。その場合、近似式計算手段921は、近似式を選択せず、データ入力手段91から入力した新規のデータを未確定データ記憶手段923に出力して記憶させる。
On the other hand, the approximate
次に、近似式計算手段921による近似式の特定処理の例を具体的に説明する。図7は、予め定められた精度の制約を満たす近似式を選択する例を示す説明図である。図7に示す例では、近似式計算手段921に入力される新たなデータの発生時刻をtiとし、そのデータ値をxiとする。図7に示す例では、値xiの新たなデータP1022が時刻tiに発生し、データ入力手段91から近似式計算手段921に入力されているものとする。また、代表近似式記憶手段3には、近似式x=f0(t)、x=f1(t)、x=f2(t)、及びx=f3(t)が記憶されているものとする。また、近似式に要求される精度の制約は、近似値と実際のデータとの差分がε未満であることとする。
Next, an example of the approximate expression specifying process by the approximate
近似式計算手段921は、各近似式に対して、時刻t=tiを代入して、それぞれ近似値X1010=f0(ti)、X1011=f1(ti)、X1012=f2(ti)、及びX1013=f3(ti)を計算する。図7に示す例では、近似式f2, f3を用いて算出した近似値X1012=f2(ti)、及びX1013=f3(ti)が精度の制約値εを満たしている。従って、近似式計算手段921は、この精度の制約条件を満たす近似式f2,f3の中から、予め定められた条件に従って1つの近似式を特定する。
The approximate expression calculation means 921 substitutes time t = t i for each approximate expression, and approximate values X 1010 = f 0 (t i ), X 1011 = f 1 (t i ), X 1012 = Calculate f 2 (t i ) and X 1013 = f 3 (t i ). In the example shown in FIG. 7, the approximate values X 1012 = f 2 (t i ) and X 1013 = f 3 (t i ) calculated using the approximate expressions f 2 and f 3 satisfy the accuracy constraint value ε. Yes. Therefore, the approximate
例えば、近似式の精度が最良のものを特定するという条件に従って1つの近似式を特定する場合には、近似式計算手段921は、図7に示す例では、|xi-f3(ti)|<|xi-f2(ti)|<εであることから、近似式f3を特定して出力手段922に出力する。
For example, when one approximate expression is specified according to the condition that the accuracy of the approximate expression is specified, the approximate
未確定データ記憶手段923は、データ値の近似値を求めるための近似式がまだ特定されていないデータを記憶する記憶装置である。代表近似式記憶手段3が記憶する既存のいずれの近似式を用いて近似値を計算しても、実際のデータ値と近似値との差が大きいと判定されるデータが、未確定データ記憶手段923に記憶されていく。なお、本実施形態では、データを、発生時刻及びデータ値を座標とする点として捉えることができるので、その近似式が未確定のデータが位置する座標上の点を「未確定点」とも表現する。
The indeterminate
入力データを近似する代表近似式が見つからない場合に新たに生成する、発生時刻を変数としてデータ値の近似値を求めるための近似式は、未確定データ記憶手段923に記憶される複数の未確定点に基づいて導出される。本実施形態では、近似式を決定するために必要な個数分のデータが揃うまで、未確定データ記憶手段923は、未確定点に該当するデータを記憶していく。なお、近似式を決定するために必要なデータの個数は、近似式の種類(1次式であるか、2次式であるか、又は三角関数を用いた式であるか等)や、近似式の決定アルゴリズムに依存する。近似式の種類や近似式決定アルゴリズムは予め決められていて、その近似式の種類や近似式決定アルゴリズムに応じて、近似式の決定に要するデータの個数も予め定められているものとする。
An approximate expression for obtaining an approximate value of the data value using the occurrence time as a variable, which is newly generated when a representative approximate expression that approximates the input data is not found, is a plurality of unconfirmed data stored in the unconfirmed data storage means 923. Derived based on points. In the present embodiment, the undetermined
新規近似式生成手段924は、新たにデータが入力されたときに、未確定データ記憶手段923に記憶されている未確定点について、近似式を決定するために必要な個数分のデータが揃ったならば、それらのデータに基づいて、発生時刻を変数としてデータ値を算出するための関数(近似式)を生成する機能を備える。
The new approximate
例えば、近似式生成に要するデータ数がk個であり、未確定データ記憶手段923にk-1個の未確定点が記憶されているとする。このとき、未確定データ記憶手段923に新たに1つのデータが入力され記憶されることでk個のデータが揃うと、新規近似式生成手段924は、未確定データ記憶手段923に記憶されたk個のデータに基づいて新たな近似式を生成する。また、新規近似式生成手段924は、生成した近似式を、全近似式記憶手段2に記憶させる。また、新規近似式生成手段924は、出力手段922に、k個のデータに対して、それぞれ、そのデータの発生時刻と新たに生成した近似式とを対応付けた組を出力する。すなわち、新規近似式生成手段924は、データの発生時刻と新たに生成した近似式との組をk組出力する。
For example, it is assumed that the number of data required for generating the approximate expression is k, and k−1 uncertain points are stored in the unconfirmed
出力手段922は、近似式計算手段921又は新規近似式生成手段924から入力した1つ以上の近似式とデータの発生時刻との組を出力する。この場合、例えば、出力手段922は、ディスプレイ装置等の表示装置によって実現される場合には、近似式とデータの発生時刻との組を表示する。また、例えば、出力手段922は、近似式とデータの発生時刻との組を含むファイルを出力するものであってもよい。
The
なお、上記に示した近似手段92の構成例は一例であり、近似手段92の構成は、これに限るものではない。
Note that the configuration example of the approximating
なお、本実施形態において、データ要約装置の記憶装置は、逐次的に入力されるデータを要約する処理を実行するための各種プログラムを記憶している。例えば、データ要約装置の記憶装置は、データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、選択した代表近似式を代表近似式記憶手段に記憶させる処理とを実行させるためのデータ要約プログラムを記憶している。 In the present embodiment, the storage device of the data summarization device stores various programs for executing processing for summarizing sequentially input data. For example, the storage device of the data summarization apparatus can be used as a representative approximate expression that is a candidate for approximating newly generated data in a computer including all approximate expression storage means for storing a plurality of approximate expressions for approximating data. The approximate value obtained by using each approximate expression based on the current time from the approximate expressions stored in the all approximate expression storage means is included in the range of values that the data can take. And a data summarizing program for executing a process of selecting an approximate expression within a predetermined number and a process of storing the selected representative approximate expression in the representative approximate expression storage means.
次に、データ要約装置の動作を説明する。まず、代表近似式を選択する処理について説明する。図8は、データ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。まず、代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式のうち、現在時刻における値が値域記憶手段12に記憶された値域に属しているもののみを取り出し、代表近似式第2限定手段13に出力する(ステップS11)。なお、この場合、代表近似式第1限定手段11は、近似式f1,f2,...,fnを選択して出力したものとする。
Next, the operation of the data summarization apparatus will be described. First, processing for selecting a representative approximate expression will be described. FIG. 8 is a flowchart showing a processing example of representative approximate expression selection processing executed by the data summarization apparatus. First, the representative approximate expression first limiting
次に、代表近似式第2限定手段13は、入力された近似式の個数nと予め定められた個数Nとを比較する(ステップS12)。比較の結果、n≦Nであると判断した場合には(ステップS12のYes)、代表近似式第2限定手段13は、ステップS11で入力した全ての近似式を記憶させることによって、代表近似式記憶手段3の記憶内容を更新する(ステップS14)。一方、n>Nであると判断した場合には(ステップS12のNo)、代表近似式第2限定手段13は、ステップS11で入力した近似式の中からn-N個の近似式を取り除き、N個の近似式を選択する(ステップS13)。そして、代表近似式第2限定手段13は、残りのN個の近似式を記憶させることによって、代表近似式記憶手段3の記憶内容を更新する(ステップS14)。
Next, the representative approximate expression second limiting
次に、ステップS11における代表近似式第1限定手段11が実行する近似式の選択処理の動作について説明する。代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式fiについて、以下の処理を行う。図9は、ステップS11において全近似式記憶手段2に記憶された各近似式fiに対して行う代表近似式第1限定手段11が実行する近似式の選択処理の例を示すフローチャートである。
Next, the operation of the approximate expression selection process executed by the representative approximate expression first limiting
まず、代表近似式第1限定手段11は、現在時刻tnowにおける近似式fiの値fi(tnow)を求める(ステップS111)。次に、代表近似式第1限定手段11は、求めた近似値fi(tnow)と値域記憶手段12に記憶されている値域Vとについて、fi(tnow)∈Vとなるか否かを判定する(ステップS112)。評価の結果、fi(tnow)∈Vとなると判定した場合には(ステップS112のYes)、代表近似式第1限定手段11は、その近似式fiを代表近似式第2限定手段13に出力する(ステップS113)。一方、fi(tnow)∈Vとならないと判定した場合には(ステップS112のNo)、代表近似式第1限定手段11は、ステップS113に移行しないようにし、近似式fiを代表近似式第2限定手段13に出力しないように制御する。
First, the representative approximate expression first limiting
以上の処理に従って、全近似式記憶手段2が記憶する近似式のうち所定の精度条件を満たし且つ所定の選択条件を満たした近似式が選抜されて、代表近似式として代表近似式記憶手段3に記憶される。そして、その後、データ要約装置は、選抜されて代表近似式記憶手段3に記憶される代表近似式に基づいて、入力データの要約処理を行う。なお、データ要約装置が図8及び図9に示す代表近似式を選抜する処理を所定期間毎や所定タイミングで繰り返し実行することによって、代表近似式記憶手段3が記憶する代表近似式の精度が保たれる。 According to the above processing, an approximate expression satisfying a predetermined accuracy condition and satisfying a predetermined selection condition is selected from the approximate expressions stored in the all approximate expression storage means 2, and the representative approximate expression storage means 3 is selected as a representative approximate expression. Remembered. After that, the data summarization apparatus performs input data summarization processing based on the representative approximate expression selected and stored in the representative approximate expression storage means 3. It should be noted that the accuracy of the representative approximate expression stored in the representative approximate expression storage means 3 is maintained by the data summarizing apparatus repeatedly executing the process of selecting the representative approximate expression shown in FIGS. 8 and 9 at predetermined intervals or at predetermined timings. Be drunk.
以上に説明したように、本実施形態によれば、過去に生成した全ての近似式を用いて要約処理を行うのではなく、近似式の個数が増加し続けても代表近似式記憶手段2に記憶された、予め規定された個数以内の代表近似式のみを用いて要約処理を行う。そのため、データの要約の対象とする期間が長くなってもデータの要約を続けることが可能となる。また、そのように構成しても、所定の精度条件を満足するとともに所定条件に基づいて選択された代表近似式を用いて要約処理を行えるので、データ要約の精度が必要以上に落ちることを防止できる。従って、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。
As described above, according to the present embodiment, instead of performing summarization processing using all approximate expressions generated in the past, even if the number of approximate expressions continues to increase, the representative approximate
(第2の実施形態)
次に、本発明の第2の実施形態を図面を参照して説明する。図10は、第2の実施形態によるデータ要約装置の構成例を示すブロック図である。なお、本実施形態において、第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。図10に示すように、本実施形態では、データ要約装置は、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13と、新規近似式追加管理手段21と、全近似式記憶手段2と、代表近似式記憶手段3と、近似式更新手段95とを含む。従って、本実施形態では、データ要約装置は、第1の実施形態で示した構成要素に加えて、近似式更新手段95を含む。また、データ要約装置の代表近似式管理部1は、第1の実施形態で示した構成要素に加えて、新規近似式追加管理手段21を含む。
(Second embodiment)
Next, a second embodiment of the present invention will be described with reference to the drawings. FIG. 10 is a block diagram illustrating a configuration example of the data summarizing device according to the second embodiment. In the present embodiment, components similar to those in the first embodiment are denoted by the same reference numerals as those in FIG. 1, and description thereof is omitted. As shown in FIG. 10, in this embodiment, the data summarizing device includes a range storage means 12, a representative approximate expression first limiting
近似式更新手段95は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。近似式更新手段95は、新たに近似式を生成し、全近似式記憶手段2に記憶させることによって、近似式を随時更新する機能を備える。また、近似式更新手段95は、新たな近似式を新規近似式追加管理手段21に出力する機能を備える。なお、近似式更新手段95は、例えば、新たに入力した近似式を全近似式記憶手段2に記憶させる処理を行うものであってもよい。また、近似式更新手段95は、例えば、第1の実施形態で示した新規近似式生成手段924によって実現されてもよい。
Specifically, the approximate
新規近似式追加管理手段21は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。新規近似式追加管理手段21は、近似式更新手段95から全近似式記憶手段2に追加すべき新しい近似式を入力として受ける(入力する)機能を備える。また、新規近似式追加管理手段21は、代表近似式第1限定手段11を起動すべきと判断すると、入力した近似式を含む新たな代表近似式の候補を代表近似式第1限定手段11に出力することで、代表近似式第1限定手段11を起動させる機能を備える。
Specifically, the new approximate expression addition management means 21 is realized by a CPU of an information processing apparatus that operates according to a program. The new approximate expression addition management means 21 has a function of receiving (inputting) a new approximate expression to be added to the all approximate expression storage means 2 from the approximate expression update means 95 as an input. Further, when the new approximate expression addition managing means 21 determines that the representative approximate expression first limiting
なお、新規近似式追加管理手段21による代表近似式第1限定手段11の起動は、近似式更新手段95からの入力の度に行ってもよいし、近似式更新手段95から一定回数の入力がある毎に行っても構わない。あるいは、最後に新規近似式追加管理手段21が起動されてから一定以上の時間の経過毎に行っても、それら複数起動条件の組み合わせで行っても構わない。なお、そのような代表近似式第1限定手段11の起動方法は一例であり、代表近似式第1限定手段11を起動する方法は、これらに限るものではない。
The activation of the representative approximate expression first limiting
次に、データ要約装置の動作を説明する。図11は、第2の実施形態によるデータ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。まず、新規近似式追加管理手段21は、近似式更新手段95から新しい近似式を入力する(ステップS21)と、代表近似式を更新すべきか否かを判定する(ステップS22)。なお、この場合、近似式更新手段95から入力した新しい近似式をfNEWとする。代表近似式を更新すべきであると判断すると(ステップS22のYes)、新規近似式追加管理手段21は、代表近似式の最後の更新時(すなわち、前回の代表近似式の選択処理時)以降に追加された近似式を全近似式記憶手段2から抽出し、新たな近似式fNEWとともに代表近似式第1限定手段11に出力する(ステップS23)。
Next, the operation of the data summarization apparatus will be described. FIG. 11 is a flowchart illustrating a processing example of representative approximate expression selection processing executed by the data summarizing apparatus according to the second embodiment. First, when a new approximate expression addition management means 21 inputs a new approximate expression from the approximate expression update means 95 (step S21), it determines whether or not the representative approximate expression should be updated (step S22). In this case, the new approximate expression input from the approximate expression update means 95 is defined as fNEW . If it is determined that the representative approximate expression should be updated (Yes in step S22), the new approximate expression addition managing means 21 is after the last update of the representative approximate expression (that is, during the last representative approximate expression selection process). the added approximate expression to extract from all the approximate equation storing means 2, and outputs with a new approximation formula f nEW to the first limiting
例えば、前回の代表近似式記憶手段3が記憶する代表近似式の更新処理時以降に、近似式更新手段95から近似式g1,g2,...,gmを入力している場合には、新規近似式追加管理手段21は、全近似式記憶手段2から、それらの近似式g1,g2,...,gmを読み込む。そして、新規近似式追加管理手段21は、読み込んだ近似式g1,g2,...,gmとともに、新たな近似式fNEWを代表近似式第1限定手段11に出力する。
For example, when the approximate expressions g 1 , g 2 ,..., G m are input from the approximate expression update means 95 after the previous update process of the representative approximate expressions stored in the representative approximate expression storage means 3 The new approximate expression addition management means 21 reads the approximate expressions g 1 , g 2 ,..., G m from the all approximate expression storage means 2. Then, the new approximate expression addition management means 21 outputs the new approximate expression f NEW to the representative approximate expression first limiting
一方、代表近似式を更新すべきでないと判断した場合には(ステップS22のNo)、データ要約装置は、代表近似式の更新を行うことなく、そのまま処理を終了する。 On the other hand, when it is determined that the representative approximate expression should not be updated (No in step S22), the data summarizing apparatus ends the process without updating the representative approximate expression.
次いで、代表近似式第1限定手段11は、代表近似式記憶手段3が記憶する現在の近似式と、新規近似式追加管理手段21から入力した近似式とのうち、現在時刻における値が値域記憶手段12に記憶された値域に属しているもののみを取り出し、代表近似式第2限定手段13に出力する(ステップS24)。そして、データ要約装置は、第1の実施形態で示したステップS12〜S14と同様の処理に従って、代表近似値を更新する処理を行う。
Next, the representative approximation formula first limiting means 11 stores the value at the current time among the current approximation formula stored in the representative approximation formula storage means 3 and the approximation formula input from the new approximation formula addition management means 21 in the range storage. Only those belonging to the value range stored in the
以上に説明したように、本実施形態によれば、代表近似式第1限定手段11と代表近似式第2限定手段13とによる代表近似式の選出処理が、新しい近似式の決定のタイミングに応じて行われる。従って、データの発生タイミングが不規則で、新しい近似式の決定タイミングが予測不能な場合でも、新しい近似式の決定に応じて代表近似式の選出処理を行うことができるので、さらに新しくより適切な近似式を代表近似式とすることができる。
As described above, according to the present embodiment, the representative approximate expression selection processing by the representative approximate expression first limiting
(第3の実施形態)
次に、本発明の第3の実施形態を図面を参照して説明する。図12は、第3の実施形態によるデータ要約装置の構成例を示すブロック図である。なお、本実施形態において、第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。図12に示すように、本実施形態では、データ要約装置は、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13と、全近似式記憶手段2と、代表近似式記憶手段3と、代表近似式リソース監視手段31と、代表近似式管理制御手段32とを含む。従って、本実施形態では、データ要約装置の代表近似式管理部1は、第1の実施形態で示した構成要素に加えて、代表近似式リソース監視手段31と、代表近似式管理制御手段32とを含む。
(Third embodiment)
Next, a third embodiment of the present invention will be described with reference to the drawings. FIG. 12 is a block diagram illustrating a configuration example of the data summarizing device according to the third embodiment. In the present embodiment, components similar to those in the first embodiment are denoted by the same reference numerals as those in FIG. 1, and description thereof is omitted. As shown in FIG. 12, in the present embodiment, the data summarizing device includes a
代表近似式リソース監視手段31は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。代表近似式リソース監視手段31は、少なくとも、代表近似式を記憶する領域の使用可能なリソース量を監視し、その監視結果を代表近似式管理制御手段32に出力する機能を備える。すなわち、代表近似式リソース監視手段31は、代表近似式記憶手段3における使用可能なリソース量(例えば、情報処理装置が備える記憶装置の記憶領域のうち、代表近似式記憶手段3として割り当て可能な記憶領域の容量)を監視する。例えば、代表近似式記憶手段3が他の記憶手段と同一の記憶装置上で実現されているならば、代表近似式リソース監視手段31は、その記憶装置における使用可能なリソース量を監視すればよい。
Specifically, the representative approximate expression
例えば、代表近似式リソース監視手段31は、代表近似式記憶手段3として使用可能なリソース量の一例として、代表近似式記憶手段3を実現する物理メモリの空き容量を監視する。なお、このような代表近似式リソース監視手段31が監視するリソースの例は一例であり、代表近似式リソース監視手段31によって監視されるリソースは、これに限るものではない。例えば、代表近似式記憶手段3がディスク装置(磁気ディスク装置や光ディスク装置)によって実現される場合には、代表近似式リソース監視手段31は、ディスク装置の未使用率を監視してもよい。また、代表近似式リソース監視手段31は、例えば、使用可能なリソース量の代わりに、既に使用中のリソース量(例えば、メモリの使用容量)を監視してもよい。また、代表近似式リソース監視手段31は、例えば、監視対象のリソース量として、代表近似式を使用した近似の評価に使用するリソース(例えば、CPU時間)を監視しても構わない。
For example, the representative approximate expression
また、代表近似式リソース監視手段31は、例えば、リソースの監視タイミングとして、一定時間毎に代表近似式記憶手段3を監視しても構わない。あるいは、代表近似式リソース監視手段31は、例えば、ユーザ操作等に従って、任意のタイミングで監視を行うよう指示が入力された際に、リソースの監視を行ってもよい。
Further, the representative approximate expression
代表近似式管理制御手段32は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。代表近似式管理制御手段32は、代表近似式リソース監視手段31から入力した監視結果に応じて、代表近似式記憶手段3が記憶する代表近似式の最大個数Nを決定する機能を備える。また、代表近似式管理制御手段32は、最大個数Nが変化した場合に、代表近似式第1限定手段11を起動させて代表近似式を更新させる機能を備える。
Specifically, the representative approximate expression management control means 32 is realized by a CPU of an information processing apparatus that operates according to a program. The representative approximate expression management control means 32 has a function of determining the maximum number N of representative approximate expressions stored in the representative approximate expression storage means 3 in accordance with the monitoring result input from the representative approximate expression resource monitoring means 31. Further, the representative approximate expression management control means 32 has a function of starting the representative approximate expression first limiting
例えば、代表近似式記憶手段3が記憶する代表近似式の最大個数の候補Nsmall、Nlarge(Nsmall<Nlarge)を予め定めておき、代表近似式管理制御手段32は、代表近似式リソース監視手段31から監視結果として入力した使用可能なリソース量が閾値以上であるか否かを判定する。閾値以上であれば、代表近似式管理制御手段32は、最大個数としてNlargeを選択し、代表近似式記憶手段3にNlarge個の代表近似式を記憶させるように制御する。一方、閾値未満であれば、代表近似式管理制御手段32は、最大個数としてNsmallを選択し、Nsmall個の代表近似式を記憶させるように制御すればよい。すなわち、リソースに余裕があれば代表近似式の最大個数を多くし、リソースに余裕がなければ代表近似式の最大個数を少なくするように制御すればよい。
For example, the maximum number of candidates N small and N large (N small <N large ) stored in the representative approximate
あるいは、例えば、代表近似式記憶手段3が記憶する代表近似式の最大個数としてN1,N2,...,Nk(N1<N2<...<Nk)を予め定めておき、代表近似式管理制御手段32は、代表近似式リソース監視手段31から監視結果として入力可能なリソース量Rとk-1個の閾値T1,T2,...,Tk-1(T1<T2<...<Tk-1)とを比較する。そして、代表近似式管理制御手段32は、代表近似式記憶手段3が記憶する代表近似式の最大個数Nを、R≦T1と判定した場合にはN=N1と決定し、Ti-1<R≦Tiと判定した場合にはN=Ni(i=1,2,..,k-1)と決定し、Tk-1<Rと判定した場合にはN=Nkと決定してもよい。あるいは、例えば、代表近似式管理制御手段32は、代表近似式の最大個数Nを、R<T1と判定した場合にはN=N1と決定し、Ti-1≦R<Tiと判定した場合にはN=Ni(i=1,2,..,k-1)と決定し、Tk-1≦Rと判定した場合にはN=Nkと決定しても構わない。又は、代表近似式管理制御手段32は、代表近似式の最大個数Nを、使用可能な空きリソース量に関する有界な広義単調増加関数N(R)により、N=N(R)と定めてもよい。なお、そのような代表近似式の最大個数Nの決定方法は一例であり、最大個数Nの決定方法は、これに限るものではない。 Alternatively, for example, N 1 , N 2 ,..., N k (N 1 <N 2 <... <N k ) are determined in advance as the maximum number of representative approximate expressions stored in the representative approximate expression storage means 3. The representative approximate expression management control means 32 receives the resource amount R that can be input from the representative approximate expression resource monitoring means 31 as a monitoring result and k−1 threshold values T 1 , T 2 ,..., T k−1 ( T 1 <T 2 <... <T k-1 ). Then, the representative approximate expression management control means 32 determines that the maximum number N of representative approximate expressions stored in the representative approximate expression storage means 3 is N = N 1 when it is determined that R ≦ T 1, and T i− If it is determined that 1 <R ≦ T i , N = N i (i = 1, 2, .., k−1) is determined, and if T k−1 <R is determined, N = N k May be determined. Alternatively, for example, the representative approximate expression management control means 32 determines that N = N 1 when the maximum number N of representative approximate expressions is determined as R <T 1 and T i−1 ≦ R <T i If determined, N = N i (i = 1, 2, .., k−1) may be determined, and if T k−1 ≦ R, N = N k may be determined. . Alternatively, the representative approximate expression management control means 32 may determine that the maximum number N of representative approximate expressions is N = N (R) by a bounded monotonically increasing function N (R) with respect to the amount of available free resources. Good. Note that the method for determining the maximum number N of such representative approximate expressions is an example, and the method for determining the maximum number N is not limited to this.
以上に説明したように、本実施形態によれば、代表近似式を記憶するリソース量に応じて、代表近似式の最大個数Nを決定する。そのため、リソースに余裕があれば、多くの代表近似式を使用することで、より高精度にデータの値を近似することができる。一方で、リソースに余裕がなければ代表近似式の数を少なくして、必要最低限の代表近似式を用いてデータ要約を行うことができる。 As described above, according to the present embodiment, the maximum number N of representative approximate expressions is determined according to the amount of resources for storing the representative approximate expressions. Therefore, if there is a margin in resources, the data values can be approximated with higher accuracy by using many representative approximation formulas. On the other hand, if there are not enough resources, the number of representative approximate expressions can be reduced, and data summarization can be performed using the minimum necessary representative approximate expressions.
なお、上記の各実施形態で示した各手段は、1台の計算機上で、CPUや、メモリ、ディスク装置を用いて実現しても構わない。あるいは、ネットワークで接続された互いに通信できる複数の計算機を用いて、上記の各実施形態で示した各手段を実現しても構わない。 Note that each means described in each of the above embodiments may be realized by using a CPU, a memory, and a disk device on one computer. Alternatively, each means shown in each of the above embodiments may be realized using a plurality of computers connected to each other via a network.
次に、本発明によるデータ要約装置の最小構成について説明する。図13は、データ要約装置の最小の構成例を示すブロック図である。図13に示すように、データ要約装置は、最小の構成要素として、代表近似式管理部1と、全近似式記憶手段2と、代表近似式記憶手段3とを含む。
Next, the minimum configuration of the data summarizing apparatus according to the present invention will be described. FIG. 13 is a block diagram showing a minimum configuration example of the data summarizing apparatus. As shown in FIG. 13, the data summarizing apparatus includes a representative approximate
図13に示す最小構成のデータ要約装置において、代表近似式記憶手段3は、データを近似するための近似式を複数記憶する。また、代表近似式管理部1は、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段2が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する機能を備える。また、代表近似式記憶手段3は、代表近似式管理部1が選択した代表近似式を記憶する。
In the data summarizing apparatus with the minimum configuration shown in FIG. 13, the representative approximate expression storage means 3 stores a plurality of approximate expressions for approximating data. Further, the representative approximate
図13に示す最小構成のデータ要約装置によれば、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。 According to the data summarizing apparatus having the minimum configuration shown in FIG. 13, data summarization can be continued even when the period of data summarization becomes longer when the value of the data suddenly changes.
なお、上記に示した各実施形態では、以下の(1)〜(8)に示すようなデータ要約装置の特徴的構成が示されている。 In each of the embodiments described above, the characteristic configuration of the data summarization apparatus as shown in the following (1) to (8) is shown.
(1)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。 (1) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximation expressions for approximating data. As a representative approximate expression that is a candidate for approximating newly generated data, the approximate expression stored in the all approximate expression storage means is obtained using each approximate expression based on the current time. Representative approximate expression selection means (for example, realized by the representative approximate expression management unit 1) for selecting an approximate expression included in the range of the range where the approximate value is a range of values that the data can take, and representative approximation And a representative approximate expression storage means (for example, realized by the representative approximate expression storage means 3) for storing the representative approximate expression selected by the expression selection means.
(2)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。 (2) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximate expressions for approximating data. As a representative approximate expression that is a candidate for approximating newly generated data, the approximate expression stored in the all approximate expression storage means is obtained using each approximate expression based on the current time. Representative approximate expression selection means (for example, representative approximate expression management unit 1) that selects an approximate expression within the range of values that are values that the data can take and that is within a predetermined number. And a representative approximate expression storage means (for example, realized by the representative approximate expression storage means 3) for storing the representative approximate expression selected by the representative approximate expression selecting means.
(3)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。 (3) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximate expressions for approximating data. Selected from the multiple approximation formulas stored in the total approximation formula storage means as a representative approximation formula that is a candidate for approximating newly generated data. Representative approximate expression selection means (for example, realized by the representative approximate expression management unit 1) and representative approximate expression storage means for storing the representative approximate expression selected by the representative approximate expression selection means (for example, representative approximate expression storage means 3) It is characterized by the above.
(4)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を代表近似式として選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含むように構成されていてもよい。 (4) In the data summarizing apparatus, the representative approximate expression selecting means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that can be taken by the data, and an all approximate expression storage. An approximate value obtained using each approximate expression based on the current time is included in the range of values indicated by the range information stored in the range storage means from all the approximate expressions stored by the means. First approximation formula selection means (for example, realized by the representative approximation formula first limiting means 11) that selects only the approximation formula and an approximation formula selected by the first approximation formula selection means are predetermined. The second approximate expression selecting means (for example, realized by the representative approximate expression second limiting means 13) for selecting the approximate expression within the predetermined number as the representative approximate expression may be included.
(5)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、近似式が追加されたときに、代表近似式記憶手段が記憶する代表近似式を更新すべきか否かを判定する近似式更新判定手段(例えば、新規近似式追加管理手段21によって実現される)と、近似式更新判定手段によって代表近似式を更新すべきと判定されたときに、代表近似式記憶手段が記憶する代表近似式と、代表近似式記憶手段が記憶する代表近似式を過去に更新したとき以降に追加された近似式との中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式の中から,予め定められた個数以内の近似式を代表近似式として選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含むように構成されていてもよい。 (5) In the data summarization apparatus, the representative approximation formula selection means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that the data can take, and an approximate expression. An approximate expression update determination means for determining whether or not the representative approximate expression stored in the representative approximate expression storage means should be updated (for example, realized by the new approximate expression addition management means 21), and an approximate expression update When the determination means determines that the representative approximate expression should be updated, the representative approximate expression stored in the representative approximate expression storage means and the representative approximate expression stored in the representative approximate expression storage means are added after the past update. Only approximate expressions that are included in the range of values indicated by the range information stored in the range storage means, are approximate values obtained using the approximate formulas based on the current time. Select Of the approximate expressions selected by the first approximate expression selecting means (for example, realized by the representative approximate expression first limiting means 11) and the approximate expression selected by the first approximate expression selecting means, an approximate expression within a predetermined number. The second approximate expression selecting means (for example, realized by the representative approximate expression second limiting means 13) may be included.
(6)データ要約装置において、代表近似式選択手段は、代表近似式記憶手段が使用可能なリソース量を監視する代表近似式リソース監視手段(例えば、代表近似式リソース監視手段31によって実現される)と、代表近似式記憶手段が使用可能なリソース量に基づいて、代表近似式記憶手段に記憶させる代表近似式の個数を決定し、代表近似式記憶手段を更新させる代表近似式更新制御手段(例えば、代表近似式管理制御手段32によって実現される)とを含むように構成されていてもよい。 (6) In the data summarizing device, the representative approximate expression selecting means is representative approximate expression resource monitoring means (for example, realized by the representative approximate expression resource monitoring means 31) for monitoring the resource amount usable by the representative approximate expression storage means. And a representative approximate expression update control means for determining the number of representative approximate expressions to be stored in the representative approximate expression storage means and updating the representative approximate expression storage means (for example, , Realized by the representative approximate expression management control means 32).
(7)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式に基づいて代表近似式を選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含み、第2の近似式選択手段は、第1の近似式選択手段が選択した近似式が予め定められた個数以内であるか否かを判定し、予め定められた個数以内であると判定した場合には、第1の近似式選択手段が選択した近似式をそのまま代表近似式として決定し、予め定められた個数以内でないと判定した場合には、第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を代表近似式として選択するように構成されていてもよい。 (7) In the data summarizing apparatus, the representative approximate expression selecting means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that can be taken by the data, and an all approximate expression storage. An approximate value obtained using each approximate expression based on the current time is included in the range of values indicated by the range information stored in the range storage means from all the approximate expressions stored by the means. A first approximate expression selecting means (for example, realized by the representative approximate expression first limiting means 11) for selecting only the approximate expression and a representative approximate expression based on the approximate expression selected by the first approximate expression selecting means Second approximate expression selection means (for example, realized by the representative approximate expression second limiting means 13) to select, the second approximate expression selection means is the approximate expression selected by the first approximate expression selection means Whether or not is within a predetermined number If it is determined that the number is within the predetermined number, the approximate expression selected by the first approximate expression selecting unit is determined as the representative approximate expression as it is, and if it is determined that the number is not within the predetermined number The approximate expression selected by the first approximate expression selecting means may be configured to select an approximate expression within a predetermined number as the representative approximate expression.
(8)データ要約装置は、代表近似式記憶手段が記憶する各代表近似式を用いてデータを近似する近似手段(例えば、近似手段92によって実現される)を備え、近似手段は、代表近似式記憶手段が記憶する各代表近似式を用いて算出した近似値と実データの値との誤差に基づいて、代表近似式記憶手段が記憶する各代表近似式の中から、データの近似に用いる近似式を決定する近似式決定手段(例えば、近似式計算手段921によって実現される)と、代表近似式記憶手段が記憶する各代表近似式の中にデータの近似に使用可能な近似式がない場合に、新たに近似式を生成する近似式生成手段(例えば、新規近似式生成手段924によって実現される)とを含むように構成されていてもよい。 (8) The data summarizing apparatus includes approximation means (for example, realized by the approximation means 92) for approximating data using each representative approximation expression stored in the representative approximation expression storage means. Based on the error between the approximate value calculated using each representative approximate expression stored in the storage means and the value of the actual data, the approximation used for data approximation from the representative approximate expressions stored in the representative approximate expression storage means When there is no approximate expression that can be used to approximate the data in the approximate expression determining means (for example, realized by the approximate expression calculating means 921) for determining the expression and each representative approximate expression stored in the representative approximate expression storing means In addition, an approximate expression generation unit (for example, realized by the new approximate expression generation unit 924) that newly generates an approximate expression may be included.
本発明は、近似式による近似処理を用いてデータを要約するデータ要約装置の用途に好適に適用可能である。 The present invention can be suitably applied to the use of a data summarization apparatus that summarizes data using an approximation process using an approximate expression.
1 代表近似式管理部
2 全近似式記憶手段
3 代表近似式記憶手段
11 代表近似式第1限定手段
12 値域記憶手段
13 代表近似式第2限定手段
21 新規近似式追加管理手段
31 代表近似式リソース監視手段
32 代表近似式管理制御手段
91 データ入力手段
92 近似手段
95 近似式更新手段
921 近似式計算手段
922 出力手段
923 未確定データ記憶手段
924 新規近似式生成手段
1 Representative approximation formula management department
2 All approximation formula storage means
3 Representative approximation formula storage means
11 Representative approximation formula 1st limiting means
12 Range storage means
13 Representative approximation formula second limiting means
21 New approximation formula addition management means
31 Representative approximate resource monitoring means
32 Representative approximate expression management control means
91 Data input means
92 Approximate means
95 Approximation formula update method
921 Approximation formula calculation means
922 Output means
923 Indeterminate data storage means
924 New approximate expression generation means
Claims (10)
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。 A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. Representative approximate expression selecting means for selecting an approximate expression included in a range of a value range that can be taken by data;
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。 A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. Representative approximate expression selection means for selecting an approximate expression that is included in a range of values that can be taken by the data and that is within a predetermined number,
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。 A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
Representative approximate expression for selecting an approximate expression within a predetermined number from a plurality of approximate expressions stored in the all approximate expression storage means as a representative approximate expression to be a candidate for approximating newly generated data A selection means;
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
前記全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を前記代表近似式として選択する第2の近似式選択手段とを含む
請求項1から請求項3のうちのいずれか1項に記載のデータ要約装置。 The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
A value indicated by the range information stored in the range storage means is an approximate value obtained by using each approximation formula based on the current time among all the approximate formulas stored in the total approximation formula storage means First approximation formula selection means for selecting only the approximation formula included in the range of
The second approximate expression selecting means for selecting, as the representative approximate expression, an approximate expression within a predetermined number from the approximate expressions selected by the first approximate expression selecting means. 4. The data summarization device according to any one of 3.
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
近似式が追加されたときに、前記代表近似式記憶手段が記憶する前記代表近似式を更新すべきか否かを判定する近似式更新判定手段と、
前記近似式更新判定手段によって前記代表近似式を更新すべきと判定されたときに、前記代表近似式記憶手段が記憶する前記代表近似式と、前記代表近似式記憶手段が記憶する前記代表近似式を過去に更新したとき以降に追加された近似式との中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式の中から,予め定められた個数以内の近似式を前記代表近似式として選択する第2の近似式選択手段とを含む
請求項1から請求項3のうちのいずれか1項に記載のデータ要約装置。 The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
Approximate expression update determination means for determining whether or not the representative approximate expression stored in the representative approximate expression storage means should be updated when an approximate expression is added;
The representative approximate expression stored in the representative approximate expression storage means and the representative approximate expression stored in the representative approximate expression storage means when the approximate expression update determination means determines that the representative approximate expression should be updated. The approximate value obtained by using each approximate expression based on the current time from the approximate expressions added after the time is updated in the past is indicated by the range information stored in the range storage means. A first approximation formula selection means for selecting only the approximation formula included in the value range;
The second approximate expression selecting means for selecting, as the representative approximate expression, an approximate expression within a predetermined number from the approximate expressions selected by the first approximate expression selecting means. 4. The data summarization device according to any one of 3.
前記代表近似式記憶手段が使用可能なリソース量を監視する代表近似式リソース監視手段と、
前記代表近似式記憶手段が使用可能なリソース量に基づいて、前記代表近似式記憶手段に記憶させる前記代表近似式の個数を決定し、前記代表近似式記憶手段を更新させる代表近似式更新制御手段とを含む
請求項1から請求項4のうちのいずれか1項に記載のデータ要約装置。 The representative approximate expression selection means includes:
Representative approximate expression resource monitoring means for monitoring the amount of resources that can be used by the representative approximate expression storage means;
Based on the amount of resources that can be used by the representative approximate expression storage means, the representative approximate expression update control means for determining the number of the representative approximate expressions to be stored in the representative approximate expression storage means and updating the representative approximate expression storage means The data summarization device according to any one of claims 1 to 4.
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
前記全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式に基づいて前記代表近似式を選択する第2の近似式選択手段とを含み、
前記第2の近似式選択手段は、
前記第1の近似式選択手段が選択した近似式が予め定められた個数以内であるか否かを判定し、
予め定められた個数以内であると判定した場合には、前記第1の近似式選択手段が選択した近似式をそのまま前記代表近似式として決定し、
予め定められた個数以内でないと判定した場合には、前記第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を前記代表近似式として選択する
請求項1から請求項6のうちのいずれか1項に記載のデータ要約装置。 The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
A value indicated by the range information stored in the range storage means is an approximate value obtained by using each approximation formula based on the current time among all the approximate formulas stored in the total approximation formula storage means First approximation formula selection means for selecting only the approximation formula included in the range of
A second approximate expression selecting means for selecting the representative approximate expression based on the approximate expression selected by the first approximate expression selecting means,
The second approximate expression selecting means is
Determining whether the approximate expression selected by the first approximate expression selecting means is within a predetermined number,
When it is determined that the number is within a predetermined number, the approximate expression selected by the first approximate expression selection unit is determined as the representative approximate expression as it is,
If it is determined that the number is not less than a predetermined number, an approximate expression within a predetermined number is selected as the representative approximate expression from the approximate expressions selected by the first approximate expression selection unit. The data summarization device according to any one of claims 1 to 6.
前記近似手段は、
前記代表近似式記憶手段が記憶する前記各代表近似式を用いて算出した近似値と実データの値との誤差に基づいて、前記代表近似式記憶手段が記憶する前記各代表近似式の中から、データの近似に用いる近似式を決定する近似式決定手段と、
前記代表近似式記憶手段が記憶する前記各代表近似式の中にデータの近似に使用可能な近似式がない場合に、新たに近似式を生成する近似式生成手段とを含む
請求項1から請求項7のうちのいずれか1項に記載のデータ要約装置。 Approximating means for approximating data using each representative approximate expression stored in the representative approximate expression storing means;
The approximation means includes
Based on the error between the approximate value calculated using each representative approximate expression stored in the representative approximate expression storage means and the value of the actual data, the representative approximate expression stored in the representative approximate expression storage means Approximation expression determining means for determining an approximation expression used for data approximation;
The approximate expression generation means for newly generating an approximate expression when there is no approximate expression usable for data approximation in the representative approximate expressions stored in the representative approximate expression storage means. Item 8. The data summarization device according to any one of items 7 to 9.
データを近似するための近似式を全近似式記憶手段に複数記憶し、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択し、
選択した前記代表近似式を代表近似式記憶手段に記憶する
ことを特徴とするデータ要約方法。 A data summarization method for summarizing sequentially generated data,
A plurality of approximation formulas for approximating data are stored in all approximation formula storage means,
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. , Select an approximate expression that is included in the range of values that can be taken by the data, and within a predetermined number,
A data summarizing method, wherein the selected representative approximate expression is stored in a representative approximate expression storage means.
データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、
選択した前記代表近似式を代表近似式記憶手段に記憶させる処理と
を実行させるためのデータ要約プログラム。 A data summarization program for summarizing sequentially generated data,
In a computer provided with all approximate expression storage means for storing a plurality of approximate expressions for approximating data,
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. A process of selecting an approximate expression that is included in a range of values that can be taken by the data and that is within a predetermined number;
A data summarization program for executing the process of storing the selected representative approximate expression in the representative approximate expression storage means.
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010002488A JP2011141777A (en) | 2010-01-08 | 2010-01-08 | Apparatus, method and program for data summarization |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010002488A JP2011141777A (en) | 2010-01-08 | 2010-01-08 | Apparatus, method and program for data summarization |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2011141777A true JP2011141777A (en) | 2011-07-21 |
Family
ID=44457564
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010002488A Pending JP2011141777A (en) | 2010-01-08 | 2010-01-08 | Apparatus, method and program for data summarization |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2011141777A (en) |
-
2010
- 2010-01-08 JP JP2010002488A patent/JP2011141777A/en active Pending
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US11568300B2 (en) | Apparatus and method for managing machine learning with plurality of learning algorithms and plurality of training dataset sizes | |
| US20160321331A1 (en) | Device and method | |
| US20180144251A1 (en) | Server and cloud computing resource optimization method thereof for cloud big data computing architecture | |
| US10423902B2 (en) | Parallel processing apparatus and method of estimating power consumption of jobs | |
| JP6327234B2 (en) | Event analysis device, event analysis system, event analysis method, and event analysis program | |
| US20090077235A1 (en) | Mechanism for profiling and estimating the runtime needed to execute a job | |
| US20140298321A1 (en) | Installation control method and installation control apparatus | |
| US10552460B2 (en) | Sensor data management apparatus, sensor data management method, and computer program product | |
| EP3413197A1 (en) | Task scheduling method and device | |
| CN105491079B (en) | Method and device for adjusting resources required by application in cloud computing environment | |
| US11651271B1 (en) | Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios | |
| JP2008305402A (en) | Method, computer program and system for identifying instruction to obtain representative trace | |
| US20120317069A1 (en) | Throughput sustaining support system, device, method, and program | |
| CN110968802B (en) | Analysis method and analysis device for user characteristics and readable storage medium | |
| WO2017188419A1 (en) | Computational resource management device, computational resource management method, and computer-readable recording medium | |
| JPWO2012176923A1 (en) | Anonymization index determination device and method, and anonymization processing execution system and method | |
| JPWO2014199920A1 (en) | Prediction function creation device, prediction function creation method, and program | |
| JPWO2016178316A1 (en) | Computer procurement forecasting apparatus, computer procurement forecasting method, and program | |
| JP2019212043A (en) | Computer system and learning control method | |
| US20240303134A1 (en) | Systems and methods for edge resource demand load estimation | |
| US20240305535A1 (en) | Systems and methods for edge system resource capacity dynamic policy planning framework | |
| US20240303130A1 (en) | Systems and methods for edge resource demand load scheduling | |
| JPWO2015141218A1 (en) | Information processing apparatus, analysis method, and program recording medium | |
| JP2020154934A (en) | Power consumption prediction program, power consumption prediction method, and power consumption prediction device | |
| JPWO2011016281A1 (en) | Information processing apparatus and program for Bayesian network structure learning |