[go: up one dir, main page]

JP2011141777A - Apparatus, method and program for data summarization - Google Patents

Apparatus, method and program for data summarization Download PDF

Info

Publication number
JP2011141777A
JP2011141777A JP2010002488A JP2010002488A JP2011141777A JP 2011141777 A JP2011141777 A JP 2011141777A JP 2010002488 A JP2010002488 A JP 2010002488A JP 2010002488 A JP2010002488 A JP 2010002488A JP 2011141777 A JP2011141777 A JP 2011141777A
Authority
JP
Japan
Prior art keywords
approximate expression
representative
data
approximate
storage means
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010002488A
Other languages
Japanese (ja)
Inventor
Teruyuki Imai
照之 今井
Tomoo Ebiyama
知生 海老山
Koji Kida
弘司 喜田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2010002488A priority Critical patent/JP2011141777A/en
Publication of JP2011141777A publication Critical patent/JP2011141777A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To continue data summarization, even if a target period for data summarization is extended when a data value is suddenly changed. <P>SOLUTION: The data summarization apparatus for summarizing successively generated data includes: an all approximation formula memory for storing a plurality of approximation formulas for approximating data; a representative approximation formula selector for selecting an approximation formula in which an approximate value found out by using each approximation formula based on present time is included within a range scope to be a scope of values to be taken by data from the approximation formulas stored in the all approximation formula memory, as a representative approximation formula to be a candidate for approximating newly generated data; and a representative approximation formula memory for storing the representative approximation formula selected by the representative approximation formula selector. <P>COPYRIGHT: (C)2011,JPO&INPIT

Description

本発明は、逐次的に発生するデータを逐次的に近似により要約して情報量を削減するデータ要約装置、データ要約方法、及びデータ要約プログラムに関する。   The present invention relates to a data summarization apparatus, a data summarization method, and a data summarization program that reduce the amount of information by sequentially summarizing sequentially generated data by approximation.

時系列データの値を複数の近似式により表して近似する技術が提案されている。例えば、特許文献1には、学習用データに基づいて、その学習用データを近似する関数を作成する関連技術が記載されている。   There has been proposed a technique for approximating the value of time series data by representing it by a plurality of approximation formulas. For example, Patent Document 1 describes a related technique for creating a function that approximates learning data based on the learning data.

特許文献1に記載された関連技術では、学習用のデータをまずクラスタリングし、次に各クラスタに対してそのクラスタのデータを表す近似式を作成し、各クラスタの近似式の誤差を評価する。そして、近似式の誤差が大きなクラスタに対しては再帰的にクラスタリング、近似式作成、及び評価を行う。また、クラスタの情報と各近似式とはそれぞれ記憶され、入力データはまず所属クラスタを判定され、そのクラスタの近似式を用いて入力データの近似値が計算される。   In the related technique described in Patent Document 1, learning data is first clustered, then an approximate expression representing the data of the cluster is created for each cluster, and an error in the approximate expression of each cluster is evaluated. Then, clustering, approximation formula creation, and evaluation are performed recursively for clusters with large errors in approximation formulas. Further, the cluster information and each approximate expression are stored, and the input data first determines the cluster to which it belongs, and the approximate value of the input data is calculated using the approximate expression of the cluster.

また、例えば、特許文献2には、関連する技術として、プラントデータを近似式を用いて近似し保存するデータ圧縮保存装置が記載されている。また、特許文献2に記載された関連技術では、近似式により予想される値と実際の入力データの値との偏差を求め、求めた偏差が所定の閾値より大きい場合にはその入力データを保存すると判断して保存し、所定の閾値より小さい場合にはデータ保存の必要がないと判断することが記載されている。   For example, Patent Document 2 describes a data compression and storage device that approximates and stores plant data using an approximate expression as a related technique. Further, in the related technique described in Patent Document 2, the deviation between the value predicted by the approximate expression and the actual input data value is obtained, and if the obtained deviation is larger than a predetermined threshold, the input data is stored. It is described that it is determined that the data is stored, and if it is smaller than a predetermined threshold, it is determined that the data need not be stored.

特開平7−65168号公報JP-A-7-65168 特許第3242936号明細書Japanese Patent No. 3242936

特許文献1に記載された関連技術では、精度が一定以上になるまでクラスタリングと近似式の作成とを再帰的に繰り返す。そのため、逐次的に発生し値が突発的に変化するデータを近似する場合には、クラスタと近似式の個数とが増加し続ける。すると、連続的に発生する時系列データを近似式で近似するデータ要約装置に特許文献1に記載された関連技術を適用し、長期間にわたり連続的に発生するデータを逐次的に扱い続けると、データ発生毎に行われるクラスタの判定の計算量が増加し続けることなる。そして、データが発生する毎の計算量が増加し続けてデータ要約装置の処理速度を越えてしまうと、近似式によるデータの近似が行えなくなる。   In the related technique described in Patent Document 1, clustering and creation of an approximate expression are recursively repeated until the accuracy reaches a certain level. Therefore, in the case of approximating data that occurs sequentially and whose value changes suddenly, the number of clusters and approximate expressions continues to increase. Then, by applying the related technology described in Patent Document 1 to a data summarization device that approximates continuously generated time series data with an approximate expression, and continuously handling data that occurs continuously over a long period of time, The amount of calculation of cluster determination performed each time data is generated continues to increase. If the amount of calculation for each data generation continues to increase and exceeds the processing speed of the data summarization apparatus, the approximation of the data by the approximate expression cannot be performed.

従って、特許文献1に記載された関連技術を用いても、逐次的に発生するデータの値が突発的に変化する場合には、データの要約の対象となる期間が長くなると、データの要約を続けることが難しくなる。   Therefore, even if the related technique described in Patent Document 1 is used, if the data value that occurs sequentially changes suddenly, the data summarization is performed when the period of data summarization becomes longer. It becomes difficult to continue.

なお、逐次的に発生するデータであって、データ値が突発的に大きく変化するデータの一例として、CPUの使用率等が挙げられる。このように、データ値が不規則に突然大きく変化するデータの圧縮を行う場合には、特許文献1に記載された関連技術は適さない。   An example of data that is sequentially generated and whose data value changes suddenly is a CPU usage rate. As described above, the related art described in Patent Document 1 is not suitable for compressing data whose data values suddenly and suddenly change greatly.

また、特許文献2に記載された関連技術を用いれば、実際の入力データの値が近似式で予想される値からどの程度離れているか否かを判別して保存対象のデータを選別することによって、データ保存を効率的に行っている。しかし、入力データの近似を1つの近似式のみを用いて行っており、入力データの値の変化傾向がある程度一定である場合にしか適さない。従って、特許文献2に記載された関連技術を用いて、突発的に変化するデータを近似することはできない。   In addition, by using the related technique described in Patent Document 2, it is possible to determine how far the actual input data value is from the value expected by the approximate expression and to select the data to be stored. , Saving data efficiently. However, approximation of input data is performed using only one approximation formula, and this is only suitable when the change tendency of the value of the input data is constant to some extent. Therefore, it is impossible to approximate data that changes suddenly by using the related technique described in Patent Document 2.

そこで、本発明は、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができるデータ要約装置、データ要約方法、及びデータ要約プログラムを提供することを目的とする。   Therefore, the present invention provides a data summarization apparatus, a data summarization method, and data capable of continuing data summarization even when the data summarization period is long when the data value suddenly changes. The purpose is to provide a summary program.

本発明によるデータ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。   A data summarization device according to the present invention is a data summarization device for summarizing sequentially generated data, and is used for approximating newly generated data and all approximation formula storage means for storing a plurality of approximation formulas for approximating data. As a representative approximate expression that is a candidate for, the approximate value obtained using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a range of values that the data can take And a representative approximate expression selecting means for selecting an approximate expression included in the range and a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.

本発明によるデータ要約装置の他の態様は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。   Another aspect of the data summarization device according to the present invention is a data summarization device for summarizing sequentially generated data, all approximate expression storage means for storing a plurality of approximate expressions for approximating data, and newly generated data As an approximate expression that is a candidate for approximating, an approximate value obtained by using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a value that can be taken by the data. A representative approximate expression selecting means for selecting an approximate expression within a predetermined range and within a predetermined number, and a representative approximate expression for storing the representative approximate expression selected by the representative approximate expression selecting means And a storage means.

本発明によるデータ要約装置のさらに他の態様は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段とを備えたことを特徴とする。   Still another aspect of the data summarizing device according to the present invention is a data summarizing device for summarizing sequentially generated data, a total approximation formula storing means for storing a plurality of approximation formulas for approximating data, and a newly generated data summarization device. Representative approximate expression selection means for selecting an approximate expression within a predetermined number from among a plurality of approximate expressions stored in all approximate expression storage means as representative approximate expressions that are candidates for approximating data, and representative And a representative approximate expression storing means for storing the representative approximate expression selected by the approximate expression selecting means.

本発明によるデータ要約方法は、逐次発生するデータを要約するデータ要約方法であって、データを近似するための近似式を全近似式記憶手段に複数記憶し、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択し、選択した代表近似式を代表近似式記憶手段に記憶することを特徴とする。   A data summarization method according to the present invention is a data summarization method for summarizing sequentially generated data, in which a plurality of approximation formulas for approximating data are stored in a total approximation formula storage means, and newly generated data is approximated. As a representative approximate expression that is a candidate for, the approximate value obtained using each approximate expression based on the current time from the approximate expressions stored by all approximate expression storage means is a range of values that the data can take And an approximate expression within a predetermined number is selected, and the selected representative approximate expression is stored in the representative approximate expression storage means.

本発明によるデータ要約プログラムは、逐次発生するデータを要約するためのデータ要約プログラムであって、データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、選択した代表近似式を代表近似式記憶手段に記憶させる処理とを実行させるためのものである。   A data summarization program according to the present invention is a data summarization program for summarizing sequentially generated data, and is newly generated in a computer having all approximate expression storage means for storing a plurality of approximate expressions for approximating data. As a representative approximate expression that is a candidate for approximating the obtained data, the approximate value obtained using each approximate expression based on the current time can be taken from the approximate expression stored in the all approximate expression storage means. A process of selecting an approximate expression that is included in a value range that is a range of values and that is within a predetermined number, and a process of storing the selected representative approximate expression in the representative approximate expression storage unit are executed. Is for.

本発明によれば、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。   According to the present invention, when the value of data suddenly changes, data summarization can be continued even if the period for which data summarization is performed becomes longer.

本発明によるデータ要約装置の構成例を示すブロック図である。It is a block diagram which shows the structural example of the data summarization apparatus by this invention. 全近似式記憶手段が記憶する近似式を表すデータの一例を示す説明図である。It is explanatory drawing which shows an example of the data showing the approximate expression which all approximate expression memory | storage means memorize | stores. 代表近似式管理部の構成例を示すブロック図である。It is a block diagram which shows the structural example of a representative approximate expression management part. 値域記憶手段が記憶する値域を表すデータの一例を示す説明図である。It is explanatory drawing which shows an example of the data showing the range which a range storage means memorize | stores. 代表近似式記憶手段が記憶する代表近似式を表すデータの一例を示す説明図である。It is explanatory drawing which shows an example of the data showing the representative approximate expression which a representative approximate expression memory | storage means memorize | stores. 近似手段の構成の一例を示すブロック図である。It is a block diagram which shows an example of a structure of an approximation means. 予め定められた精度の制約を満たす近似式を選択する例を示す説明図である。It is explanatory drawing which shows the example which selects the approximate expression which satisfy | fills the precision restrictions defined beforehand. データ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。It is a flowchart which shows the process example of the selection process of the representative approximation formula which a data summarization apparatus performs. 代表近似式第1限定手段が実行する近似式の選択処理の例を示すフローチャートである。12 is a flowchart illustrating an example of an approximate expression selection process executed by a representative approximate expression first limiting unit. 第2の実施形態によるデータ要約装置の構成例を示すブロック図である。FIG. 6 is a block diagram showing a configuration example of a data summarizing device according to a second embodiment. 第2の実施形態によるデータ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。10 is a flowchart showing a processing example of representative approximate expression selection processing executed by the data summarizing apparatus according to the second embodiment. 第3の実施形態によるデータ要約装置の構成例を示すブロック図である。FIG. 10 is a block diagram illustrating a configuration example of a data summarizing device according to a third embodiment. データ要約装置の最小の構成例を示すブロック図である。It is a block diagram which shows the minimum structural example of a data summarization apparatus.

以下、本発明の実施形態を図面を参照して説明する。まず最初に、本発明によるデータ要約装置全体の概略を説明する。本発明によるデータ要約装置は、時間経過に沿って逐次的に発生するデータの情報量を削減する。情報量を削減することにより、データ自体をそのまま正確に記憶する場合に比べて、データを記憶するために必要となる記憶容量を抑えることができる。本実施形態では、このようにデータの情報量を削減することを「要約」という。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. First, an outline of the entire data summarizing apparatus according to the present invention will be described. The data summarization apparatus according to the present invention reduces the amount of data that is sequentially generated over time. By reducing the amount of information, it is possible to reduce the storage capacity required for storing data, compared to the case where the data itself is stored exactly as it is. In the present embodiment, reducing the amount of data information in this way is referred to as “summary”.

一般に、要約によってデータの精度は低下するが、本発明によるデータ要約装置は、時間経過に沿って逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータを、精度よく、効率的に要約する。   In general, although the accuracy of data is reduced by summarization, the data summarization device according to the present invention is data that is generated with a constant tendency sequentially over time, and the tendency of the data may change irregularly. Summarize certain data accurately and efficiently.

逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータの例として、例えば、「CPUの使用率」が挙げられる。なお、CPUの使用率に限らず、例えば、観測対象とするWebページの単位時間当たりのアクセス数や、Webページ公開後からの総アクセス数等の情報も、突発的に値が変化するので、「逐次的に一定の傾向で発生するデータであって、不規則に変化することがあるデータ」に該当する。また、例えば、ネットワーク機器の通信量等も「逐次的に一定の傾向で発生するデータであって、データの傾向が不規則に変化することがあるデータ」に該当する。なお、「逐次的に発生するデータ」は、「逐次的に観測可能なデータ」も含む概念である。   For example, “CPU usage rate” is an example of data that is generated sequentially with a certain tendency and the tendency of the data may change irregularly. In addition, not only the CPU usage rate, but also the information such as the number of accesses per unit time of the web page to be observed, the total number of accesses after the web page has been released, etc. suddenly change, so This corresponds to “data that occurs sequentially with a certain tendency and may change irregularly”. In addition, for example, the communication amount of the network device also corresponds to “data that is sequentially generated in a certain tendency and the data tendency may change irregularly”. “Sequentially generated data” is a concept including “sequentially observable data”.

「逐次的に一定の傾向で発生するデータであって、不規則に変化することがあるデータ」として、以下の説明では、時間経過とともに発生する数値を例にして説明する。ただし、データ自体が数値でなくても、数値化可能であり、数値化したデータ同士の差分を導出できるデータであればよい。   In the following description, numerical values that occur over time will be described as an example as “data that is generated sequentially with a certain tendency and may change irregularly”. However, even if the data itself is not a numerical value, it can be converted into a numerical value, and any data can be used as long as the difference between the converted data can be derived.

なお、以下に示す例では、各データは、データ値と、そのデータ値の発生時刻とを対応付けて含む。以下の説明において、このデータ値の発生時刻を、単にデータの発生時刻と呼ぶ場合がある。   In the example shown below, each data includes a data value and an occurrence time of the data value in association with each other. In the following description, the occurrence time of this data value may be simply referred to as the occurrence time of data.

なお、以下の説明では、時系列に逐次的に発生するデータを用いる場合を示しているが、何らかの順序性をもつデータであれば、例えば、距離が近い順や遠い順等の位置的な順序性をもったデータを逐次的に入力して解析を行う場合にも適用できる。また、短い時間間隔(例えば、数秒間隔)で連続して発生されるデータに限らず、逐次的に発生するデータであれば、例えば、数時間や数日等の長い時間間隔で発生するデータや、発生間隔が一定しないようなデータを扱う場合にも適用できる。   In the following description, the case where data that occurs sequentially in time series is used is shown. However, if the data has some order, for example, the positional order such as the order of distance or the order of distance It can also be applied to the case of performing analysis by sequentially inputting characteristic data. Further, the data is not limited to data generated continuously at short time intervals (for example, every few seconds), but may be data generated at long time intervals such as several hours or days as long as the data is generated sequentially. It can also be applied to the case of handling data whose occurrence interval is not constant.

また、本発明によるデータ要約装置は、発生したデータの集合に基づいて、発生時刻を変数とし、データ値(数値)を算出するための関数を導出する。この関数は、発生時刻に基づいてデータ値の近似値を求めるための近似式である。   In addition, the data summarization apparatus according to the present invention derives a function for calculating a data value (numerical value) based on a set of generated data, with the generation time as a variable. This function is an approximate expression for obtaining an approximate value of a data value based on the occurrence time.

(第1の実施形態)
次に、本発明の第1の実施形態を図面を参照して説明する。図1は、本発明によるデータ要約装置の構成例を示すブロック図である。図1に示すように、本実施形態は、データ要約装置は、代表近似式管理部1と、全近似式記憶手段2と、代表近似式記憶手段3と、データ入力手段91と、近似手段92とを含む。なお、データ要約装置は、具体的には、プログラムに従って動作するパーソナルコンピュータ等の情報処理装置によって実現される。
(First embodiment)
Next, a first embodiment of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram showing a configuration example of a data summarization apparatus according to the present invention. As shown in FIG. 1, in this embodiment, the data summarizing apparatus includes a representative approximate expression management unit 1, a total approximate expression storage means 2, a representative approximate expression storage means 3, a data input means 91, and an approximation means 92. Including. The data summarization apparatus is specifically realized by an information processing apparatus such as a personal computer that operates according to a program.

全近似式記憶手段2は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。全近似式記憶手段2は、過去のデータの値(近似値)を求めるための全ての近似式を、それぞれの近似式を識別するためのIDとともに対応付けて記憶する。例えば、過去のデータの値が1次元の実数で表され、データの値を当該データの発生時刻についての1次関数により近似する場合、全近似式記憶手段2は、近似式のID、1次関数の係数、及び定数項を対応付けて記憶すればよい。なお、このような情報の例は一例であり、全近似式記憶手段2が記憶する情報は、これらに限るものではない。   Specifically, the total approximate storage unit 2 is realized by a storage device such as a magnetic disk device or an optical disk device. All approximate expression storage means 2 stores all approximate expressions for obtaining past data values (approximate values) in association with IDs for identifying the respective approximate expressions. For example, when past data values are represented by one-dimensional real numbers and the data values are approximated by a linear function with respect to the time of occurrence of the data, the total approximate expression storage means 2 stores the ID of the approximate expression, the primary The coefficient of the function and the constant term may be stored in association with each other. Note that examples of such information are merely examples, and the information stored in all approximate expression storage means 2 is not limited to these.

図2は、全近似式記憶手段2が記憶する近似式を表すデータの一例を示す説明図である。図2に示す例では、データの値xが当該データ発生時刻tの1次関数x=at+bにより近似される場合を示している。図2に示す例では、全近似式記憶手段2は、各近似式として、ID(T20)と、1次関数の係数(T21)と、定数項(T22)とを対応付けた組を記憶している。なお、以下、1次関数の係数(T21)のことを単に1次係数ともいう。   FIG. 2 is an explanatory diagram showing an example of data representing the approximate expression stored in the all approximate expression storage means 2. As shown in FIG. The example shown in FIG. 2 shows a case where the data value x is approximated by a linear function x = at + b of the data generation time t. In the example shown in FIG. 2, the total approximate expression storage unit 2 stores, as each approximate expression, a set in which ID (T20), a linear function coefficient (T21), and a constant term (T22) are associated with each other. ing. Hereinafter, the coefficient (T21) of the linear function is also simply referred to as a linear coefficient.

図2において、ID(T20)は、過去のデータの値を近似するための1次関数を識別するための識別子である。1次係数(T21)は、1次関数x=at+bにおける時刻tに関する1次の係数(1次関数における傾きの値)である。定数項(T22)は、1次関数の定数項(1次関数における切片の値)である。   In FIG. 2, ID (T20) is an identifier for identifying a linear function for approximating past data values. The linear coefficient (T21) is a linear coefficient (the slope value in the linear function) related to the time t in the linear function x = at + b. The constant term (T22) is a constant term of the linear function (intercept value in the linear function).

代表近似式管理部1は、具体的には、プログラムに従って動作する情報処理装置のCPU、及び磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。代表近似式管理部1は、全近似式記憶手段2に記憶されている全ての近似式の中から、予め定められた個数以内の近似式を選出する機能を備える。また、代表近似式管理部1は、選出した近似式を代表近似式記憶手段3に出力して、代表近似式記憶手段3に近似式を記憶させる機能を備える。なお、代表近似式管理部1により選出された近似式を、以下、代表近似式と呼ぶ。   Specifically, the representative approximate expression management unit 1 is realized by a CPU of an information processing device that operates according to a program and a storage device such as a magnetic disk device or an optical disk device. The representative approximate expression management unit 1 has a function of selecting an approximate expression within a predetermined number from all approximate expressions stored in the all approximate expression storage means 2. The representative approximate expression management unit 1 has a function of outputting the selected approximate expression to the representative approximate expression storage means 3 and storing the approximate expression in the representative approximate expression storage means 3. The approximate expression selected by the representative approximate expression management unit 1 is hereinafter referred to as a representative approximate expression.

図3は、代表近似式管理部1の構成例を示すブロック図である。本実施形態では、代表近似式管理部1は、図3に示すように、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13とを含む。   FIG. 3 is a block diagram illustrating a configuration example of the representative approximate expression management unit 1. In this embodiment, the representative approximate expression management unit 1 includes a range storage means 12, a representative approximate expression first limiting means 11, and a representative approximate expression second limiting means 13, as shown in FIG.

値域記憶手段12は、データ入力手段91が入力するデータの値がとりうる範囲(値域)を記憶する。例えば、データ要約装置が要約対象とするデータがCPUの使用率[%]である場合には、入力データの値は0以上100以下の実数(すなわち[0,100]={x|0≦x≦100})となる筈である。この場合、値域記憶手段12は、入力データがとりうる最小の値と最大の値とである0と100とを記憶する。なお、このような情報の例は一例であり、値域記憶手段12が記憶する情報は、これに限るものではない。   The value range storage unit 12 stores a range (value range) that the data value input by the data input unit 91 can take. For example, when the data to be summarized by the data summarization apparatus is the CPU usage rate [%], the value of the input data is a real number between 0 and 100 (ie, [0,100] = {x | 0 ≦ x ≦ 100 }). In this case, the value range storage means 12 stores 0 and 100 which are the minimum value and the maximum value that the input data can take. The example of such information is an example, and the information stored in the range storage unit 12 is not limited to this.

図4は、値域記憶手段12が記憶する値域を表すデータの一例を示す説明図である。図4に示す例では、データの値域が[0, 10]である場合が示されており、値域記憶手段12は、値域の最大値T121と最小値T122とを記憶している。 FIG. 4 is an explanatory diagram illustrating an example of data representing a range stored by the range storage unit 12. As illustrated in FIG. In the example shown in FIG. 4, the case where the value range of the data is [0, 10] is shown, and the range storage means 12 stores the maximum value T121 and the minimum value T122 of the range.

代表近似式第1限定手段11は、全近似式記憶手段2が記憶する過去のデータを表す全ての近似式の中から、代表近似式の候補として、現在時刻における値が値域に属しているもののみを抽出して代表近似式第2限定手段13に出力する機能を備える。   The representative approximation formula first limiting means 11 is one in which the value at the current time belongs to the range as a candidate for the representative approximation formula from all the approximation formulas representing the past data stored in the all approximation formula storage means 2 And a function of extracting only the representative approximate expression second limiting means 13.

代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式fi (i=1,2,.., n)を入力として受け取る(入力する)。また、代表近似式第1限定手段11は、入力した各近似式fiを用いて、現在時刻tnow における近似値fi(tnow)を求める。そして、代表近似式第1限定手段11は、全近似式記憶手段2が記憶する近似式のうち、求めた現在時刻tnow における値fi(tnow)が値域Vに属しているfiのみを選択して、代表近似式第2限定手段13に出力する。 The representative approximate expression first limiting means 11 receives (inputs) all approximate expressions f i (i = 1, 2,..., N) stored in the all approximate expression storage means 2 as inputs. Also, the representative approximate expression first limiting means 11 obtains an approximate value f i (t now ) at the current time t now using each input approximate expression f i . Then, the representative approximate expression first limiting means 11, of the approximate expression total approximate equation storing means 2 stores the value at the current time t now obtained f i (t now) only f i that belong to range V Is output to the representative approximation formula second limiting means 13.

なお、代表近似式第1限定手段11は、予め定めた一定時間毎に、全近似式記憶手段2から近似式を読み込んで、現在時刻における近似値が値域に属する近似式を選択する処理を行ってもよい。あるいは、代表近似式第1限定手段11は、ユーザ等の操作に従って、代表近似式を更新したい任意のタイミングで起動指示を入力して、全近似式記憶手段2から近似式を読み込んで、現在時刻における近似値が値域に属する近似式を選択する処理を行ってもよい。   The representative approximate expression first limiting means 11 reads the approximate expression from the entire approximate expression storage means 2 at predetermined intervals and performs a process of selecting an approximate expression whose approximate value at the current time belongs to the range. May be. Alternatively, the representative approximate expression first limiting means 11 inputs an activation instruction at an arbitrary timing at which the representative approximate expression is desired to be updated according to an operation of the user, etc., reads the approximate expression from the all approximate expression storage means 2, and reads the current time You may perform the process which selects the approximate expression in which the approximate value in belongs to a range.

代表近似式第2限定手段13は、代表近似式第1限定手段11が出力した近似式を入力として受け取り(入力し)、その中から予め定められた個数以下の近似式を選出する機能を備える。また、代表近似式第2限定手段13は、選出(選択)した近似式を代表近似式記憶手段3に出力、代表近似式記憶手段3に近似式を記憶させる機能を備える。   The representative approximate expression second limiting means 13 has a function of receiving (inputting) the approximate expression output by the representative approximate expression first limiting means 11 as an input and selecting an approximate expression equal to or less than a predetermined number from the input. . The representative approximate expression second limiting means 13 has a function of outputting the selected (selected) approximate expression to the representative approximate expression storing means 3 and storing the approximate expression in the representative approximate expression storing means 3.

代表近似式第2限定手段13は、例えば、代表近似式第1限定手段11からの近似式のうち、所定個数の近似式を、近似式のIDの降順(すなわち、IDの値が大きい順)に選出(選択)すればよい。近似式IDが昇順に付与されている場合、IDの降順に選出すると、代表近似式第2限定手段13は、近似式の決定された時刻が新しい順に、予め定められた個数の近似式を選択して出力することができる。なお、そのような近似式の選択方法は一例であり、代表近似式第2限定手段13が近似式を選択する方法は、このような方法に限るものではない。例えば、逆に、近似式IDが降順に付与されている場合には、代表近似式第2限定手段13は、IDの昇順に近似式を選択するようにしてもよい。   For example, the representative approximation formula second limiting means 13 selects, for example, a predetermined number of approximation formulas from the approximate approximation formula first limit means 11 in descending order of IDs of the approximate formulas (that is, in descending order of ID values). Select (select). If the approximate expression IDs are assigned in ascending order, selecting the descending order of the IDs, the representative approximate expression second limiting means 13 selects a predetermined number of approximate expressions in the order of the newest determined approximate expressions. Can be output. Note that such a method of selecting an approximate expression is an example, and the method by which the representative approximate expression second limiting means 13 selects an approximate expression is not limited to such a method. For example, conversely, when the approximate expression ID is assigned in descending order, the representative approximate expression second limiting means 13 may select the approximate expression in ascending order of the ID.

代表近似式記憶手段3は、具体的には、磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。代表近似式記憶手段3は、代表近似式管理部1が選出した予め定められた最大個数N個の代表近似式を記憶する。なお、代表近似式記憶手段3は、例えば、全近似式記憶手段2が記憶するデータと同様のデータ形式でデータを記憶しても構わない。例えば、近似式が時刻tの1次関数で表わされている場合、代表近似式記憶手段3は、近似式のID、1次関数の係数、及び定数項を対応付けて記憶すればよい。また、代表近似式記憶手段3は、例えば、近似式のIDのみを記憶しても構わない。なお、このような情報の例は一例であり、代表近似式記憶手段3が記憶する情報は、これらに限るものではない。   Specifically, the representative approximate expression storage unit 3 is realized by a storage device such as a magnetic disk device or an optical disk device. The representative approximate expression storage means 3 stores a predetermined maximum number N of representative approximate expressions selected by the representative approximate expression management unit 1. The representative approximate expression storage means 3 may store data in the same data format as the data stored in the all approximate expression storage means 2, for example. For example, when the approximate expression is represented by a linear function at time t, the representative approximate expression storage unit 3 may store the ID of the approximate expression, the coefficient of the linear function, and the constant term in association with each other. Further, the representative approximate expression storage unit 3 may store only the ID of the approximate expression, for example. Note that examples of such information are merely examples, and the information stored in the representative approximate expression storage unit 3 is not limited to these.

図5は、代表近似式記憶手段3が記憶する代表近似式を表すデータの一例を示す説明図である。図5に示す例では、データの値xが時刻の1次関数x=at+bで近似される場合を示している。図5に示す例では、代表近似式記憶手段3は、各近似式として、ID(T30)と、1次関数の係数(T31)と、定数項(T32)とを対応付けた組を記憶している。   FIG. 5 is an explanatory diagram showing an example of data representing the representative approximate expression stored in the representative approximate expression storage means 3. The example shown in FIG. 5 shows a case where the data value x is approximated by a linear function x = at + b of time. In the example shown in FIG. 5, the representative approximate expression storage unit 3 stores, as each approximate expression, a set in which an ID (T30), a coefficient of a linear function (T31), and a constant term (T32) are associated with each other. ing.

データ入力手段91は、具体的には、プログラムに従って動作する情報処理装置のCPU及び入力インタフェース部によって実現される。データ入力手段91は、時間経過にともなって逐次データを発生するデータ発生源からデータを取得(入力)する機能を備える。なお、データ発生源は、データの種類により異なる。例えば、CPU使用率を入力データとする場合には、CPU使用率を監視するユニットをデータ発生源としてもよい。また、例えば、Webページのアクセス数を入力データとする場合には、Webサーバをデータ発生源としてもよい。データ入力手段91は、データ発生源から、個々のデータとして、少なくとも、データ値と、そのデータ値の発生時刻とを対応付けて含むデータを入力する。   Specifically, the data input means 91 is realized by a CPU and an input interface unit of an information processing apparatus that operates according to a program. The data input means 91 has a function of acquiring (inputting) data from a data generation source that sequentially generates data over time. The data generation source varies depending on the type of data. For example, when the CPU usage rate is used as input data, a unit that monitors the CPU usage rate may be used as a data generation source. For example, when the number of accesses to a web page is used as input data, a web server may be used as a data generation source. The data input means 91 inputs data including at least a data value and an occurrence time of the data value as individual data from the data generation source.

近似手段92は、具体的には、プログラムに従って動作する情報処理装置のCPU、及び磁気ディスク装置や光ディスク装置等の記憶装置によって実現される。近似手段92は、データ入力手段91が取得(入力)したデータと、代表近似式記憶手段3が記憶する近似式とを入力として受け取る(入力する)機能を備える。また、近似手段92は、代表近似式記憶手段3から入力した近似式の中で十分小さい誤差でデータ入力手段91から入力したデータを表せるものが存在すれば、その近似式により入力データを近似する機能を備える。また、近似手段92は、十分小さい誤差の近似式が存在しなければ、新たな近似式を作成して全近似式記憶手段2に出力し、新たに作成した近似式を全近似式記憶手段2に記憶させる機能を備える。なお、近似手段92は、データ入力手段91からデータが入力される度に動作し、近似式を用いて入力データを近似する処理や近似式を生成する処理を実行する。   Specifically, the approximating means 92 is realized by a CPU of an information processing device that operates according to a program and a storage device such as a magnetic disk device or an optical disk device. The approximating means 92 has a function of receiving (inputting) the data acquired (input) by the data input means 91 and the approximate expression stored in the representative approximate expression storage means 3 as inputs. Further, the approximation means 92 approximates the input data by the approximate expression if there is an approximate expression input from the representative approximate expression storage means 3 that can represent the data input from the data input means 91 with a sufficiently small error. It has a function. Further, if there is no sufficiently small error approximate expression, the approximating means 92 creates a new approximate expression and outputs it to the all approximate expression storing means 2, and the newly created approximate expression is stored in the all approximate expression storing means 2 The function to memorize is provided. The approximating unit 92 operates every time data is input from the data input unit 91, and executes a process of approximating input data using an approximate expression and a process of generating an approximate expression.

図6は、近似手段92の構成の一例を示すブロック図である。図6に示す例では、近似手段92は、近似式計算手段921と、出力手段922と、未確定データ記憶手段923と、新規近似式生成手段924とを含む。   FIG. 6 is a block diagram showing an example of the configuration of the approximating means 92. As shown in FIG. In the example shown in FIG. 6, the approximating unit 92 includes an approximate formula calculating unit 921, an output unit 922, an undetermined data storage unit 923, and a new approximate formula generating unit 924.

近似式計算手段921は、代表近似式記憶手段3に記憶された近似式に対して、データ入力手段91から入力したデータ値の発生時刻に対応する値(近似値)を計算する機能を備える。すなわち、近似式計算手段921は、発生時刻の値を近似式に代入して、仮にその近似式を用いて入力データ値を近似した場合の近似値を求める。また、近似式計算手段921は、その求めた近似式に対する値とデータ入力手段91から入力したデータ値とに基づいて、入力したデータの近似値計算に適する近似式を選択する機能を備える。すなわち、例えば、近似式計算手段921は、近似式を用いて求めた近似値と、データ入力手段91から入力した実データとの値の誤差を求め、誤差が所定の許容値以内で且つ最も誤差の小さい近似式を最適な近似式として選択する。そして、近似式計算手段921は、選択した近似式とデータ値の発生時刻とを出力手段922に出力する機能を備える。   The approximate expression calculation unit 921 has a function of calculating a value (approximate value) corresponding to the generation time of the data value input from the data input unit 91 with respect to the approximate expression stored in the representative approximate expression storage unit 3. That is, the approximate expression calculation unit 921 substitutes the value of the occurrence time into the approximate expression, and obtains an approximate value when the input data value is approximated using the approximate expression. The approximate expression calculation unit 921 has a function of selecting an approximate expression suitable for calculating the approximate value of the input data based on the value for the obtained approximate expression and the data value input from the data input unit 91. That is, for example, the approximate expression calculation unit 921 calculates an error between the approximate value obtained using the approximate expression and the actual data input from the data input unit 91, and the error is within a predetermined allowable value and is the most error. Is selected as the optimum approximation formula. The approximate expression calculation unit 921 has a function of outputting the selected approximate expression and the generation time of the data value to the output unit 922.

一方、適する近似式がなければ(例えば、誤差が所定の許容値以内の近似式がなければ)、近似式計算手段921は、未確定データ記憶手段923に、データ入力手段91から入力したデータ値をそのまま出力して記憶させる。   On the other hand, if there is no suitable approximation formula (for example, if there is no approximation formula with an error within a predetermined allowable value), the approximate formula calculation means 921 sends the data value input from the data input means 91 to the undefined data storage means 923. Is output and stored as it is.

例えば、近似式計算手段921は、代表近似式記憶手段3に記憶された各近似式に対して、データ入力手段91から入力したデータの発生時刻を代入して計算した各近似値と、入力したデータの実際のデータ値とを比較する。そして、近似式計算手段921は、予め定められた精度を満たす近似式のうち、予め定められた条件に従って1つの近似式を特定する。   For example, the approximate expression calculation means 921 inputs each approximate value calculated by substituting the generation time of the data input from the data input means 91 for each approximate expression stored in the representative approximate expression storage means 3. Compare the actual data value of the data. Then, the approximate expression calculation unit 921 identifies one approximate expression according to a predetermined condition among approximate expressions that satisfy a predetermined accuracy.

なお、近似式の特定方法は任意であり、例えば、近似式計算手段921は、予め定められた精度を満たす近似式のうち、精度が最も良い近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してもよい。あるいは、近似式計算手段921は、例えば、入力したデータを表わす近似式として選んだ際に、データ要約装置の記憶手段(例えば、磁気ディスク装置や光ディスク装置)で使用する記憶容量合計の増加が最小となる近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してもよい。   Note that the method of specifying the approximate expression is arbitrary. For example, the approximate expression calculation unit 921 specifies an approximate expression having the best accuracy among the approximate expressions satisfying a predetermined accuracy, and the specified approximate expression is It may be determined that the input data value is used to approximate. Alternatively, when the approximate expression calculation means 921 is selected as an approximate expression representing the input data, for example, the increase in the total storage capacity used in the storage means (for example, a magnetic disk device or an optical disk device) of the data summarizing device is minimized. It is also possible to determine that the approximate expression that becomes is used and to use the specified approximate expression to approximate the input data value.

あるいは、近似式計算手段921は、例えば、時刻を代入した際の値の計算量が最小となる近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してよい。また、近似式計算手段921は、例えば、近似式を生成した時刻が最も新しい近似式を特定し、その特定した近似式を、入力したデータ値を近似するために用いると決定してよい。   Alternatively, the approximate expression calculation unit 921 determines, for example, that an approximate expression that minimizes the amount of calculation of the value when substituting time is specified, and that the specified approximate expression is used to approximate the input data value. You can do it. Further, the approximate expression calculation unit 921 may determine, for example, that an approximate expression with the latest time at which the approximate expression is generated is specified and that the specified approximate expression is used to approximate the input data value.

なお、上記に示した近似式の特定方法は一例に過ぎず、近似式計算手段921が近似式を特定する方法は、これらに限るものではない。   Note that the approximate expression specifying method described above is merely an example, and the method by which the approximate expression calculating unit 921 specifies the approximate expression is not limited thereto.

一方、近似式計算手段921は、予め定められた精度を満たす近似式の中から1つの近似式を特定できない場合もある。すなわち、近似式計算手段921は、予め定められた精度を満たす近似式が代表近似式記憶手段3に存在しない場合、1つの近似式を特定することができない。その場合、近似式計算手段921は、近似式を選択せず、データ入力手段91から入力した新規のデータを未確定データ記憶手段923に出力して記憶させる。   On the other hand, the approximate expression calculation unit 921 may not be able to specify one approximate expression from among approximate expressions that satisfy a predetermined accuracy. That is, the approximate expression calculation unit 921 cannot specify one approximate expression when there is no approximate expression satisfying the predetermined accuracy in the representative approximate expression storage unit 3. In this case, the approximate expression calculation means 921 does not select the approximate expression, but outputs and stores the new data input from the data input means 91 to the unconfirmed data storage means 923.

次に、近似式計算手段921による近似式の特定処理の例を具体的に説明する。図7は、予め定められた精度の制約を満たす近似式を選択する例を示す説明図である。図7に示す例では、近似式計算手段921に入力される新たなデータの発生時刻をtiとし、そのデータ値をxiとする。図7に示す例では、値xiの新たなデータP1022が時刻tiに発生し、データ入力手段91から近似式計算手段921に入力されているものとする。また、代表近似式記憶手段3には、近似式x=f0(t)、x=f1(t)、x=f2(t)、及びx=f3(t)が記憶されているものとする。また、近似式に要求される精度の制約は、近似値と実際のデータとの差分がε未満であることとする。 Next, an example of the approximate expression specifying process by the approximate expression calculating unit 921 will be described in detail. FIG. 7 is an explanatory diagram illustrating an example of selecting an approximate expression that satisfies a predetermined accuracy constraint. In the example shown in FIG. 7, the generation time of new data input to the approximate expression calculation means 921 is t i and the data value is x i . In the example shown in FIG. 7, it is assumed that new data P1022 of value x i is generated at time t i and is input from the data input means 91 to the approximate expression calculation means 921. The representative approximate expression storage means 3 stores approximate expressions x = f 0 (t), x = f 1 (t), x = f 2 (t), and x = f 3 (t). Shall. Further, the accuracy constraint required for the approximate expression is that the difference between the approximate value and the actual data is less than ε.

近似式計算手段921は、各近似式に対して、時刻t=tiを代入して、それぞれ近似値X1010=f0(ti)、X1011=f1(ti)、X1012=f2(ti)、及びX1013=f3(ti)を計算する。図7に示す例では、近似式f2, f3を用いて算出した近似値X1012=f2(ti)、及びX1013=f3(ti)が精度の制約値εを満たしている。従って、近似式計算手段921は、この精度の制約条件を満たす近似式f2,f3の中から、予め定められた条件に従って1つの近似式を特定する。 The approximate expression calculation means 921 substitutes time t = t i for each approximate expression, and approximate values X 1010 = f 0 (t i ), X 1011 = f 1 (t i ), X 1012 = Calculate f 2 (t i ) and X 1013 = f 3 (t i ). In the example shown in FIG. 7, the approximate values X 1012 = f 2 (t i ) and X 1013 = f 3 (t i ) calculated using the approximate expressions f 2 and f 3 satisfy the accuracy constraint value ε. Yes. Therefore, the approximate expression calculation unit 921 identifies one approximate expression according to a predetermined condition from the approximate expressions f 2 and f 3 that satisfy the accuracy constraint.

例えば、近似式の精度が最良のものを特定するという条件に従って1つの近似式を特定する場合には、近似式計算手段921は、図7に示す例では、|xi-f3(ti)|<|xi-f2(ti)|<εであることから、近似式f3を特定して出力手段922に出力する。 For example, when one approximate expression is specified according to the condition that the accuracy of the approximate expression is specified, the approximate expression calculation unit 921 uses | x i -f 3 (t i in the example shown in FIG. ) | <| X i −f 2 (t i ) | <ε, the approximate expression f 3 is identified and output to the output unit 922.

未確定データ記憶手段923は、データ値の近似値を求めるための近似式がまだ特定されていないデータを記憶する記憶装置である。代表近似式記憶手段3が記憶する既存のいずれの近似式を用いて近似値を計算しても、実際のデータ値と近似値との差が大きいと判定されるデータが、未確定データ記憶手段923に記憶されていく。なお、本実施形態では、データを、発生時刻及びデータ値を座標とする点として捉えることができるので、その近似式が未確定のデータが位置する座標上の点を「未確定点」とも表現する。   The indeterminate data storage unit 923 is a storage device that stores data for which an approximate expression for obtaining an approximate value of a data value has not yet been specified. Even if the approximate value is calculated using any of the existing approximate expressions stored in the representative approximate expression storage means 3, the data that is determined to have a large difference between the actual data value and the approximate value is an undetermined data storage means It will be remembered in 923. In the present embodiment, since the data can be regarded as a point having the occurrence time and the data value as coordinates, the point on the coordinate where the approximate expression of the data is located is also expressed as “undefined point”. To do.

入力データを近似する代表近似式が見つからない場合に新たに生成する、発生時刻を変数としてデータ値の近似値を求めるための近似式は、未確定データ記憶手段923に記憶される複数の未確定点に基づいて導出される。本実施形態では、近似式を決定するために必要な個数分のデータが揃うまで、未確定データ記憶手段923は、未確定点に該当するデータを記憶していく。なお、近似式を決定するために必要なデータの個数は、近似式の種類(1次式であるか、2次式であるか、又は三角関数を用いた式であるか等)や、近似式の決定アルゴリズムに依存する。近似式の種類や近似式決定アルゴリズムは予め決められていて、その近似式の種類や近似式決定アルゴリズムに応じて、近似式の決定に要するデータの個数も予め定められているものとする。   An approximate expression for obtaining an approximate value of the data value using the occurrence time as a variable, which is newly generated when a representative approximate expression that approximates the input data is not found, is a plurality of unconfirmed data stored in the unconfirmed data storage means 923. Derived based on points. In the present embodiment, the undetermined data storage unit 923 stores data corresponding to the undetermined points until the necessary number of pieces of data for determining the approximate expression are prepared. Note that the number of data necessary to determine the approximate expression depends on the type of approximate expression (whether it is a linear expression, a quadratic expression, or an expression using a trigonometric function), an approximation, etc. Depends on the formula decision algorithm. It is assumed that the type of approximate expression and the approximate expression determination algorithm are determined in advance, and the number of data required to determine the approximate expression is determined in advance according to the type of approximate expression and the approximate expression determination algorithm.

新規近似式生成手段924は、新たにデータが入力されたときに、未確定データ記憶手段923に記憶されている未確定点について、近似式を決定するために必要な個数分のデータが揃ったならば、それらのデータに基づいて、発生時刻を変数としてデータ値を算出するための関数(近似式)を生成する機能を備える。   The new approximate expression generation unit 924 has the data necessary for determining the approximate expression for the uncertain points stored in the unconfirmed data storage unit 923 when new data is input. Then, a function (approximate expression) for generating a data value using the occurrence time as a variable is provided based on the data.

例えば、近似式生成に要するデータ数がk個であり、未確定データ記憶手段923にk-1個の未確定点が記憶されているとする。このとき、未確定データ記憶手段923に新たに1つのデータが入力され記憶されることでk個のデータが揃うと、新規近似式生成手段924は、未確定データ記憶手段923に記憶されたk個のデータに基づいて新たな近似式を生成する。また、新規近似式生成手段924は、生成した近似式を、全近似式記憶手段2に記憶させる。また、新規近似式生成手段924は、出力手段922に、k個のデータに対して、それぞれ、そのデータの発生時刻と新たに生成した近似式とを対応付けた組を出力する。すなわち、新規近似式生成手段924は、データの発生時刻と新たに生成した近似式との組をk組出力する。   For example, it is assumed that the number of data required for generating the approximate expression is k, and k−1 uncertain points are stored in the unconfirmed data storage unit 923. At this time, when one piece of data is newly input and stored in the unconfirmed data storage unit 923, and k pieces of data are prepared, the new approximate expression generation unit 924 stores the k data stored in the unconfirmed data storage unit 923. A new approximate expression is generated based on the pieces of data. Further, the new approximate expression generation unit 924 stores the generated approximate expression in the all approximate expression storage unit 2. Also, the new approximate expression generation unit 924 outputs, to the output unit 922, a set in which the generation time of the data and the newly generated approximate expression are associated with each other for the k pieces of data. In other words, the new approximate expression generation unit 924 outputs k sets of sets of data generation times and newly generated approximate expressions.

出力手段922は、近似式計算手段921又は新規近似式生成手段924から入力した1つ以上の近似式とデータの発生時刻との組を出力する。この場合、例えば、出力手段922は、ディスプレイ装置等の表示装置によって実現される場合には、近似式とデータの発生時刻との組を表示する。また、例えば、出力手段922は、近似式とデータの発生時刻との組を含むファイルを出力するものであってもよい。   The output unit 922 outputs a set of one or more approximate formulas input from the approximate formula calculation unit 921 or the new approximate formula generation unit 924 and the data generation time. In this case, for example, when the output unit 922 is realized by a display device such as a display device, the output unit 922 displays a set of the approximate expression and the data generation time. In addition, for example, the output unit 922 may output a file including a set of an approximate expression and data generation time.

なお、上記に示した近似手段92の構成例は一例であり、近似手段92の構成は、これに限るものではない。   Note that the configuration example of the approximating unit 92 described above is an example, and the configuration of the approximating unit 92 is not limited to this.

なお、本実施形態において、データ要約装置の記憶装置は、逐次的に入力されるデータを要約する処理を実行するための各種プログラムを記憶している。例えば、データ要約装置の記憶装置は、データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、選択した代表近似式を代表近似式記憶手段に記憶させる処理とを実行させるためのデータ要約プログラムを記憶している。   In the present embodiment, the storage device of the data summarization device stores various programs for executing processing for summarizing sequentially input data. For example, the storage device of the data summarization apparatus can be used as a representative approximate expression that is a candidate for approximating newly generated data in a computer including all approximate expression storage means for storing a plurality of approximate expressions for approximating data. The approximate value obtained by using each approximate expression based on the current time from the approximate expressions stored in the all approximate expression storage means is included in the range of values that the data can take. And a data summarizing program for executing a process of selecting an approximate expression within a predetermined number and a process of storing the selected representative approximate expression in the representative approximate expression storage means.

次に、データ要約装置の動作を説明する。まず、代表近似式を選択する処理について説明する。図8は、データ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。まず、代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式のうち、現在時刻における値が値域記憶手段12に記憶された値域に属しているもののみを取り出し、代表近似式第2限定手段13に出力する(ステップS11)。なお、この場合、代表近似式第1限定手段11は、近似式f1,f2,...,fnを選択して出力したものとする。 Next, the operation of the data summarization apparatus will be described. First, processing for selecting a representative approximate expression will be described. FIG. 8 is a flowchart showing a processing example of representative approximate expression selection processing executed by the data summarization apparatus. First, the representative approximate expression first limiting means 11 is the only one of all approximate expressions stored in the all approximate expression storage means 2 that belongs to the value range in which the value at the current time is stored in the value range storage means 12. Is output to the representative approximate expression second limiting means 13 (step S11). In this case, it is assumed that the representative approximate expression first limiting means 11 selects and outputs the approximate expressions f 1 , f 2 ,..., F n .

次に、代表近似式第2限定手段13は、入力された近似式の個数nと予め定められた個数Nとを比較する(ステップS12)。比較の結果、n≦Nであると判断した場合には(ステップS12のYes)、代表近似式第2限定手段13は、ステップS11で入力した全ての近似式を記憶させることによって、代表近似式記憶手段3の記憶内容を更新する(ステップS14)。一方、n>Nであると判断した場合には(ステップS12のNo)、代表近似式第2限定手段13は、ステップS11で入力した近似式の中からn-N個の近似式を取り除き、N個の近似式を選択する(ステップS13)。そして、代表近似式第2限定手段13は、残りのN個の近似式を記憶させることによって、代表近似式記憶手段3の記憶内容を更新する(ステップS14)。   Next, the representative approximate expression second limiting means 13 compares the number n of input approximate expressions with a predetermined number N (step S12). As a result of the comparison, if it is determined that n ≦ N (Yes in step S12), the representative approximate expression second limiting means 13 stores all the approximate expressions input in step S11, whereby the representative approximate expression The stored contents of the storage means 3 are updated (step S14). On the other hand, if it is determined that n> N (No in step S12), the representative approximate expression second limiting means 13 removes nN approximate expressions from the approximate expression input in step S11, and N N Is selected (step S13). Then, the representative approximate expression second limiting means 13 updates the stored contents of the representative approximate expression storage means 3 by storing the remaining N approximate expressions (step S14).

次に、ステップS11における代表近似式第1限定手段11が実行する近似式の選択処理の動作について説明する。代表近似式第1限定手段11は、全近似式記憶手段2に記憶されている全ての近似式fiについて、以下の処理を行う。図9は、ステップS11において全近似式記憶手段2に記憶された各近似式fiに対して行う代表近似式第1限定手段11が実行する近似式の選択処理の例を示すフローチャートである。 Next, the operation of the approximate expression selection process executed by the representative approximate expression first limiting means 11 in step S11 will be described. Representative approximate expression first limiting means 11, for all of the approximation formula f i which is stored in the total approximate equation storing means 2 performs the following process. Figure 9 is a flow chart showing an example of approximate expression selection processing representative approximate expression first limiting means 11 for the respective approximation formula f i which is stored in the total approximate equation storing means 2 is performed in step S11.

まず、代表近似式第1限定手段11は、現在時刻tnowにおける近似式fiの値fi(tnow)を求める(ステップS111)。次に、代表近似式第1限定手段11は、求めた近似値fi(tnow)と値域記憶手段12に記憶されている値域Vとについて、fi(tnow)∈Vとなるか否かを判定する(ステップS112)。評価の結果、fi(tnow)∈Vとなると判定した場合には(ステップS112のYes)、代表近似式第1限定手段11は、その近似式fiを代表近似式第2限定手段13に出力する(ステップS113)。一方、fi(tnow)∈Vとならないと判定した場合には(ステップS112のNo)、代表近似式第1限定手段11は、ステップS113に移行しないようにし、近似式fiを代表近似式第2限定手段13に出力しないように制御する。 First, the representative approximate expression first limiting means 11 obtains the value f i (t now ) of the approximate expression f i at the current time t now (step S111). Next, the representative approximation formula first limiting means 11 determines whether or not f i (t now ) ∈V for the obtained approximate value f i (t now ) and the range V stored in the range storage unit 12. Is determined (step S112). Results of the evaluation, f i (t now) in the case of determining that a ∈ V (Yes in step S112), the representative approximate expression first limiting means 11, the second limiting means 13 representative approximation formula the approximation formula f i (Step S113). On the other hand, if it is determined that f i (t now ) ∈V does not hold (No in step S112), the representative approximation formula first limiting means 11 does not proceed to step S113, and the approximate formula f i is represented as a representative approximation. Control is performed so as not to output to the second limiting means 13.

以上の処理に従って、全近似式記憶手段2が記憶する近似式のうち所定の精度条件を満たし且つ所定の選択条件を満たした近似式が選抜されて、代表近似式として代表近似式記憶手段3に記憶される。そして、その後、データ要約装置は、選抜されて代表近似式記憶手段3に記憶される代表近似式に基づいて、入力データの要約処理を行う。なお、データ要約装置が図8及び図9に示す代表近似式を選抜する処理を所定期間毎や所定タイミングで繰り返し実行することによって、代表近似式記憶手段3が記憶する代表近似式の精度が保たれる。   According to the above processing, an approximate expression satisfying a predetermined accuracy condition and satisfying a predetermined selection condition is selected from the approximate expressions stored in the all approximate expression storage means 2, and the representative approximate expression storage means 3 is selected as a representative approximate expression. Remembered. After that, the data summarization apparatus performs input data summarization processing based on the representative approximate expression selected and stored in the representative approximate expression storage means 3. It should be noted that the accuracy of the representative approximate expression stored in the representative approximate expression storage means 3 is maintained by the data summarizing apparatus repeatedly executing the process of selecting the representative approximate expression shown in FIGS. 8 and 9 at predetermined intervals or at predetermined timings. Be drunk.

以上に説明したように、本実施形態によれば、過去に生成した全ての近似式を用いて要約処理を行うのではなく、近似式の個数が増加し続けても代表近似式記憶手段2に記憶された、予め規定された個数以内の代表近似式のみを用いて要約処理を行う。そのため、データの要約の対象とする期間が長くなってもデータの要約を続けることが可能となる。また、そのように構成しても、所定の精度条件を満足するとともに所定条件に基づいて選択された代表近似式を用いて要約処理を行えるので、データ要約の精度が必要以上に落ちることを防止できる。従って、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。   As described above, according to the present embodiment, instead of performing summarization processing using all approximate expressions generated in the past, even if the number of approximate expressions continues to increase, the representative approximate expression storage unit 2 Summarization processing is performed using only the stored representative approximation formulas within a predetermined number. Therefore, data summarization can be continued even if the period of data summarization becomes longer. Even in such a configuration, the accuracy of the data summarization can be prevented from being lowered more than necessary because the summarization process can be performed using the representative approximate expression selected based on the predetermined condition while satisfying the predetermined accuracy condition. it can. Therefore, when the value of data changes suddenly, data summarization can be continued even if the period for which data summarization is performed becomes longer.

(第2の実施形態)
次に、本発明の第2の実施形態を図面を参照して説明する。図10は、第2の実施形態によるデータ要約装置の構成例を示すブロック図である。なお、本実施形態において、第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。図10に示すように、本実施形態では、データ要約装置は、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13と、新規近似式追加管理手段21と、全近似式記憶手段2と、代表近似式記憶手段3と、近似式更新手段95とを含む。従って、本実施形態では、データ要約装置は、第1の実施形態で示した構成要素に加えて、近似式更新手段95を含む。また、データ要約装置の代表近似式管理部1は、第1の実施形態で示した構成要素に加えて、新規近似式追加管理手段21を含む。
(Second embodiment)
Next, a second embodiment of the present invention will be described with reference to the drawings. FIG. 10 is a block diagram illustrating a configuration example of the data summarizing device according to the second embodiment. In the present embodiment, components similar to those in the first embodiment are denoted by the same reference numerals as those in FIG. 1, and description thereof is omitted. As shown in FIG. 10, in this embodiment, the data summarizing device includes a range storage means 12, a representative approximate expression first limiting means 11, a representative approximate expression second limiting means 13, and a new approximate expression addition managing means 21. A total approximate expression storage means 2, a representative approximate expression storage means 3, and an approximate expression update means 95. Therefore, in this embodiment, the data summarizing apparatus includes approximate expression updating means 95 in addition to the components shown in the first embodiment. Further, the representative approximate expression management unit 1 of the data summarizing apparatus includes a new approximate expression addition management means 21 in addition to the components shown in the first embodiment.

近似式更新手段95は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。近似式更新手段95は、新たに近似式を生成し、全近似式記憶手段2に記憶させることによって、近似式を随時更新する機能を備える。また、近似式更新手段95は、新たな近似式を新規近似式追加管理手段21に出力する機能を備える。なお、近似式更新手段95は、例えば、新たに入力した近似式を全近似式記憶手段2に記憶させる処理を行うものであってもよい。また、近似式更新手段95は、例えば、第1の実施形態で示した新規近似式生成手段924によって実現されてもよい。   Specifically, the approximate expression update unit 95 is realized by a CPU of an information processing apparatus that operates according to a program. The approximate expression update unit 95 has a function of updating an approximate expression as needed by generating a new approximate expression and storing it in the all approximate expression storage means 2. The approximate expression update unit 95 has a function of outputting a new approximate expression to the new approximate expression addition management unit 21. Note that the approximate expression update unit 95 may perform a process of storing the newly input approximate expression in the all approximate expression storage unit 2, for example. Further, the approximate expression update unit 95 may be realized by the new approximate expression generation unit 924 shown in the first embodiment, for example.

新規近似式追加管理手段21は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。新規近似式追加管理手段21は、近似式更新手段95から全近似式記憶手段2に追加すべき新しい近似式を入力として受ける(入力する)機能を備える。また、新規近似式追加管理手段21は、代表近似式第1限定手段11を起動すべきと判断すると、入力した近似式を含む新たな代表近似式の候補を代表近似式第1限定手段11に出力することで、代表近似式第1限定手段11を起動させる機能を備える。   Specifically, the new approximate expression addition management means 21 is realized by a CPU of an information processing apparatus that operates according to a program. The new approximate expression addition management means 21 has a function of receiving (inputting) a new approximate expression to be added to the all approximate expression storage means 2 from the approximate expression update means 95 as an input. Further, when the new approximate expression addition managing means 21 determines that the representative approximate expression first limiting means 11 should be activated, a new representative approximate expression candidate including the input approximate expression is assigned to the representative approximate expression first limiting means 11. A function of starting the representative approximate expression first limiting means 11 by outputting is provided.

なお、新規近似式追加管理手段21による代表近似式第1限定手段11の起動は、近似式更新手段95からの入力の度に行ってもよいし、近似式更新手段95から一定回数の入力がある毎に行っても構わない。あるいは、最後に新規近似式追加管理手段21が起動されてから一定以上の時間の経過毎に行っても、それら複数起動条件の組み合わせで行っても構わない。なお、そのような代表近似式第1限定手段11の起動方法は一例であり、代表近似式第1限定手段11を起動する方法は、これらに限るものではない。   The activation of the representative approximate expression first limiting means 11 by the new approximate expression addition managing means 21 may be performed every time input from the approximate expression updating means 95, or a certain number of inputs are received from the approximate expression updating means 95. You can go every time. Alternatively, it may be performed at every elapse of a certain time or more after the new approximate expression addition management means 21 is activated last, or may be performed by a combination of these plural activation conditions. Note that such a method of starting the representative approximate expression first limiting means 11 is an example, and the method of starting the representative approximate expression first limiting means 11 is not limited to these.

次に、データ要約装置の動作を説明する。図11は、第2の実施形態によるデータ要約装置が実行する代表近似式の選択処理の処理例を示すフローチャートである。まず、新規近似式追加管理手段21は、近似式更新手段95から新しい近似式を入力する(ステップS21)と、代表近似式を更新すべきか否かを判定する(ステップS22)。なお、この場合、近似式更新手段95から入力した新しい近似式をfNEWとする。代表近似式を更新すべきであると判断すると(ステップS22のYes)、新規近似式追加管理手段21は、代表近似式の最後の更新時(すなわち、前回の代表近似式の選択処理時)以降に追加された近似式を全近似式記憶手段2から抽出し、新たな近似式fNEWとともに代表近似式第1限定手段11に出力する(ステップS23)。 Next, the operation of the data summarization apparatus will be described. FIG. 11 is a flowchart illustrating a processing example of representative approximate expression selection processing executed by the data summarizing apparatus according to the second embodiment. First, when a new approximate expression addition management means 21 inputs a new approximate expression from the approximate expression update means 95 (step S21), it determines whether or not the representative approximate expression should be updated (step S22). In this case, the new approximate expression input from the approximate expression update means 95 is defined as fNEW . If it is determined that the representative approximate expression should be updated (Yes in step S22), the new approximate expression addition managing means 21 is after the last update of the representative approximate expression (that is, during the last representative approximate expression selection process). the added approximate expression to extract from all the approximate equation storing means 2, and outputs with a new approximation formula f nEW to the first limiting means 11 representative approximate equation (step S23).

例えば、前回の代表近似式記憶手段3が記憶する代表近似式の更新処理時以降に、近似式更新手段95から近似式g1,g2,...,gmを入力している場合には、新規近似式追加管理手段21は、全近似式記憶手段2から、それらの近似式g1,g2,...,gmを読み込む。そして、新規近似式追加管理手段21は、読み込んだ近似式g1,g2,...,gmとともに、新たな近似式fNEWを代表近似式第1限定手段11に出力する。 For example, when the approximate expressions g 1 , g 2 ,..., G m are input from the approximate expression update means 95 after the previous update process of the representative approximate expressions stored in the representative approximate expression storage means 3 The new approximate expression addition management means 21 reads the approximate expressions g 1 , g 2 ,..., G m from the all approximate expression storage means 2. Then, the new approximate expression addition management means 21 outputs the new approximate expression f NEW to the representative approximate expression first limiting means 11 together with the read approximate expressions g 1 , g 2 ,..., G m .

一方、代表近似式を更新すべきでないと判断した場合には(ステップS22のNo)、データ要約装置は、代表近似式の更新を行うことなく、そのまま処理を終了する。   On the other hand, when it is determined that the representative approximate expression should not be updated (No in step S22), the data summarizing apparatus ends the process without updating the representative approximate expression.

次いで、代表近似式第1限定手段11は、代表近似式記憶手段3が記憶する現在の近似式と、新規近似式追加管理手段21から入力した近似式とのうち、現在時刻における値が値域記憶手段12に記憶された値域に属しているもののみを取り出し、代表近似式第2限定手段13に出力する(ステップS24)。そして、データ要約装置は、第1の実施形態で示したステップS12〜S14と同様の処理に従って、代表近似値を更新する処理を行う。   Next, the representative approximation formula first limiting means 11 stores the value at the current time among the current approximation formula stored in the representative approximation formula storage means 3 and the approximation formula input from the new approximation formula addition management means 21 in the range storage. Only those belonging to the value range stored in the means 12 are taken out and output to the representative approximation formula second limiting means 13 (step S24). Then, the data summarizing apparatus performs processing for updating the representative approximate value according to processing similar to steps S12 to S14 described in the first embodiment.

以上に説明したように、本実施形態によれば、代表近似式第1限定手段11と代表近似式第2限定手段13とによる代表近似式の選出処理が、新しい近似式の決定のタイミングに応じて行われる。従って、データの発生タイミングが不規則で、新しい近似式の決定タイミングが予測不能な場合でも、新しい近似式の決定に応じて代表近似式の選出処理を行うことができるので、さらに新しくより適切な近似式を代表近似式とすることができる。   As described above, according to the present embodiment, the representative approximate expression selection processing by the representative approximate expression first limiting means 11 and the representative approximate expression second limiting means 13 depends on the timing of determining a new approximate expression. Done. Therefore, even when the data generation timing is irregular and the timing of determining the new approximate expression is unpredictable, the representative approximate expression selection process can be performed according to the determination of the new approximate expression. The approximate expression can be a representative approximate expression.

(第3の実施形態)
次に、本発明の第3の実施形態を図面を参照して説明する。図12は、第3の実施形態によるデータ要約装置の構成例を示すブロック図である。なお、本実施形態において、第1の実施形態と同様の構成要素については、図1と同一の符号を付し、説明を省略する。図12に示すように、本実施形態では、データ要約装置は、値域記憶手段12と、代表近似式第1限定手段11と、代表近似式第2限定手段13と、全近似式記憶手段2と、代表近似式記憶手段3と、代表近似式リソース監視手段31と、代表近似式管理制御手段32とを含む。従って、本実施形態では、データ要約装置の代表近似式管理部1は、第1の実施形態で示した構成要素に加えて、代表近似式リソース監視手段31と、代表近似式管理制御手段32とを含む。
(Third embodiment)
Next, a third embodiment of the present invention will be described with reference to the drawings. FIG. 12 is a block diagram illustrating a configuration example of the data summarizing device according to the third embodiment. In the present embodiment, components similar to those in the first embodiment are denoted by the same reference numerals as those in FIG. 1, and description thereof is omitted. As shown in FIG. 12, in the present embodiment, the data summarizing device includes a range storage unit 12, a representative approximate expression first limiting unit 11, a representative approximate expression second limiting unit 13, and a total approximate expression storing unit 2. The representative approximate expression storage means 3, the representative approximate expression resource monitoring means 31, and the representative approximate expression management control means 32 are included. Therefore, in this embodiment, the representative approximate expression management unit 1 of the data summarizing apparatus includes a representative approximate expression resource monitoring unit 31, a representative approximate expression management control unit 32, in addition to the components shown in the first embodiment. including.

代表近似式リソース監視手段31は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。代表近似式リソース監視手段31は、少なくとも、代表近似式を記憶する領域の使用可能なリソース量を監視し、その監視結果を代表近似式管理制御手段32に出力する機能を備える。すなわち、代表近似式リソース監視手段31は、代表近似式記憶手段3における使用可能なリソース量(例えば、情報処理装置が備える記憶装置の記憶領域のうち、代表近似式記憶手段3として割り当て可能な記憶領域の容量)を監視する。例えば、代表近似式記憶手段3が他の記憶手段と同一の記憶装置上で実現されているならば、代表近似式リソース監視手段31は、その記憶装置における使用可能なリソース量を監視すればよい。   Specifically, the representative approximate expression resource monitoring unit 31 is realized by a CPU of an information processing apparatus that operates according to a program. The representative approximate expression resource monitoring means 31 has a function of monitoring at least the amount of resources that can be used in the area storing the representative approximate expression and outputting the monitoring result to the representative approximate expression management control means 32. In other words, the representative approximate expression resource monitoring unit 31 uses the amount of resources that can be used in the representative approximate expression storage unit 3 (for example, storage that can be allocated as the representative approximate expression storage unit 3 in the storage area of the storage device included in the information processing device). Monitor the capacity of the area. For example, if the representative approximate expression storage means 3 is realized on the same storage device as the other storage means, the representative approximate expression resource monitoring means 31 may monitor the amount of resources that can be used in the storage apparatus. .

例えば、代表近似式リソース監視手段31は、代表近似式記憶手段3として使用可能なリソース量の一例として、代表近似式記憶手段3を実現する物理メモリの空き容量を監視する。なお、このような代表近似式リソース監視手段31が監視するリソースの例は一例であり、代表近似式リソース監視手段31によって監視されるリソースは、これに限るものではない。例えば、代表近似式記憶手段3がディスク装置(磁気ディスク装置や光ディスク装置)によって実現される場合には、代表近似式リソース監視手段31は、ディスク装置の未使用率を監視してもよい。また、代表近似式リソース監視手段31は、例えば、使用可能なリソース量の代わりに、既に使用中のリソース量(例えば、メモリの使用容量)を監視してもよい。また、代表近似式リソース監視手段31は、例えば、監視対象のリソース量として、代表近似式を使用した近似の評価に使用するリソース(例えば、CPU時間)を監視しても構わない。   For example, the representative approximate expression resource monitoring unit 31 monitors the free space of the physical memory that realizes the representative approximate expression storage unit 3 as an example of the amount of resources that can be used as the representative approximate expression storage unit 3. The example of the resource monitored by the representative approximate resource monitoring unit 31 is merely an example, and the resource monitored by the representative approximate resource monitoring unit 31 is not limited to this. For example, when the representative approximate expression storage unit 3 is realized by a disk device (magnetic disk device or optical disk device), the representative approximate expression resource monitoring unit 31 may monitor the unused rate of the disk device. Further, the representative approximate resource monitoring unit 31 may monitor, for example, the resource amount that is already in use (for example, the used capacity of the memory) instead of the available resource amount. Further, the representative approximate expression resource monitoring unit 31 may monitor, for example, a resource (for example, CPU time) used for approximation evaluation using the representative approximate expression as the monitoring target resource amount.

また、代表近似式リソース監視手段31は、例えば、リソースの監視タイミングとして、一定時間毎に代表近似式記憶手段3を監視しても構わない。あるいは、代表近似式リソース監視手段31は、例えば、ユーザ操作等に従って、任意のタイミングで監視を行うよう指示が入力された際に、リソースの監視を行ってもよい。   Further, the representative approximate expression resource monitoring unit 31 may monitor the representative approximate expression storage unit 3 at regular intervals, for example, as the resource monitoring timing. Alternatively, the representative approximate resource monitoring unit 31 may monitor resources when an instruction to monitor at an arbitrary timing is input in accordance with, for example, a user operation.

代表近似式管理制御手段32は、具体的には、プログラムに従って動作する情報処理装置のCPUによって実現される。代表近似式管理制御手段32は、代表近似式リソース監視手段31から入力した監視結果に応じて、代表近似式記憶手段3が記憶する代表近似式の最大個数Nを決定する機能を備える。また、代表近似式管理制御手段32は、最大個数Nが変化した場合に、代表近似式第1限定手段11を起動させて代表近似式を更新させる機能を備える。   Specifically, the representative approximate expression management control means 32 is realized by a CPU of an information processing apparatus that operates according to a program. The representative approximate expression management control means 32 has a function of determining the maximum number N of representative approximate expressions stored in the representative approximate expression storage means 3 in accordance with the monitoring result input from the representative approximate expression resource monitoring means 31. Further, the representative approximate expression management control means 32 has a function of starting the representative approximate expression first limiting means 11 and updating the representative approximate expression when the maximum number N changes.

例えば、代表近似式記憶手段3が記憶する代表近似式の最大個数の候補Nsmall、Nlarge(Nsmall<Nlarge)を予め定めておき、代表近似式管理制御手段32は、代表近似式リソース監視手段31から監視結果として入力した使用可能なリソース量が閾値以上であるか否かを判定する。閾値以上であれば、代表近似式管理制御手段32は、最大個数としてNlargeを選択し、代表近似式記憶手段3にNlarge個の代表近似式を記憶させるように制御する。一方、閾値未満であれば、代表近似式管理制御手段32は、最大個数としてNsmallを選択し、Nsmall個の代表近似式を記憶させるように制御すればよい。すなわち、リソースに余裕があれば代表近似式の最大個数を多くし、リソースに余裕がなければ代表近似式の最大個数を少なくするように制御すればよい。 For example, the maximum number of candidates N small and N large (N small <N large ) stored in the representative approximate expression storage unit 3 is determined in advance, and the representative approximate expression management control unit 32 sets the representative approximate expression resource It is determined whether or not the available resource amount input as a monitoring result from the monitoring unit 31 is equal to or greater than a threshold value. If it is equal to or greater than the threshold value, the representative approximate expression management control means 32 selects N large as the maximum number and controls the representative approximate expression storage means 3 to store N large representative approximate expressions. On the other hand, if it is less than the threshold value, the representative approximate expression management control means 32 may select N small as the maximum number and control to store N small representative approximate expressions. That is, the maximum number of representative approximate expressions may be increased if there is a margin in resources, and the maximum number of representative approximation expressions may be decreased if there is not enough resources.

あるいは、例えば、代表近似式記憶手段3が記憶する代表近似式の最大個数としてN1,N2,...,Nk(N1<N2<...<Nk)を予め定めておき、代表近似式管理制御手段32は、代表近似式リソース監視手段31から監視結果として入力可能なリソース量Rとk-1個の閾値T1,T2,...,Tk-1(T1<T2<...<Tk-1)とを比較する。そして、代表近似式管理制御手段32は、代表近似式記憶手段3が記憶する代表近似式の最大個数Nを、R≦T1と判定した場合にはN=N1と決定し、Ti-1<R≦Tiと判定した場合にはN=Ni(i=1,2,..,k-1)と決定し、Tk-1<Rと判定した場合にはN=Nkと決定してもよい。あるいは、例えば、代表近似式管理制御手段32は、代表近似式の最大個数Nを、R<T1と判定した場合にはN=N1と決定し、Ti-1≦R<Tiと判定した場合にはN=Ni(i=1,2,..,k-1)と決定し、Tk-1≦Rと判定した場合にはN=Nkと決定しても構わない。又は、代表近似式管理制御手段32は、代表近似式の最大個数Nを、使用可能な空きリソース量に関する有界な広義単調増加関数N(R)により、N=N(R)と定めてもよい。なお、そのような代表近似式の最大個数Nの決定方法は一例であり、最大個数Nの決定方法は、これに限るものではない。 Alternatively, for example, N 1 , N 2 ,..., N k (N 1 <N 2 <... <N k ) are determined in advance as the maximum number of representative approximate expressions stored in the representative approximate expression storage means 3. The representative approximate expression management control means 32 receives the resource amount R that can be input from the representative approximate expression resource monitoring means 31 as a monitoring result and k−1 threshold values T 1 , T 2 ,..., T k−1 ( T 1 <T 2 <... <T k-1 ). Then, the representative approximate expression management control means 32 determines that the maximum number N of representative approximate expressions stored in the representative approximate expression storage means 3 is N = N 1 when it is determined that R ≦ T 1, and T i− If it is determined that 1 <R ≦ T i , N = N i (i = 1, 2, .., k−1) is determined, and if T k−1 <R is determined, N = N k May be determined. Alternatively, for example, the representative approximate expression management control means 32 determines that N = N 1 when the maximum number N of representative approximate expressions is determined as R <T 1 and T i−1 ≦ R <T i If determined, N = N i (i = 1, 2, .., k−1) may be determined, and if T k−1 ≦ R, N = N k may be determined. . Alternatively, the representative approximate expression management control means 32 may determine that the maximum number N of representative approximate expressions is N = N (R) by a bounded monotonically increasing function N (R) with respect to the amount of available free resources. Good. Note that the method for determining the maximum number N of such representative approximate expressions is an example, and the method for determining the maximum number N is not limited to this.

以上に説明したように、本実施形態によれば、代表近似式を記憶するリソース量に応じて、代表近似式の最大個数Nを決定する。そのため、リソースに余裕があれば、多くの代表近似式を使用することで、より高精度にデータの値を近似することができる。一方で、リソースに余裕がなければ代表近似式の数を少なくして、必要最低限の代表近似式を用いてデータ要約を行うことができる。   As described above, according to the present embodiment, the maximum number N of representative approximate expressions is determined according to the amount of resources for storing the representative approximate expressions. Therefore, if there is a margin in resources, the data values can be approximated with higher accuracy by using many representative approximation formulas. On the other hand, if there are not enough resources, the number of representative approximate expressions can be reduced, and data summarization can be performed using the minimum necessary representative approximate expressions.

なお、上記の各実施形態で示した各手段は、1台の計算機上で、CPUや、メモリ、ディスク装置を用いて実現しても構わない。あるいは、ネットワークで接続された互いに通信できる複数の計算機を用いて、上記の各実施形態で示した各手段を実現しても構わない。   Note that each means described in each of the above embodiments may be realized by using a CPU, a memory, and a disk device on one computer. Alternatively, each means shown in each of the above embodiments may be realized using a plurality of computers connected to each other via a network.

次に、本発明によるデータ要約装置の最小構成について説明する。図13は、データ要約装置の最小の構成例を示すブロック図である。図13に示すように、データ要約装置は、最小の構成要素として、代表近似式管理部1と、全近似式記憶手段2と、代表近似式記憶手段3とを含む。   Next, the minimum configuration of the data summarizing apparatus according to the present invention will be described. FIG. 13 is a block diagram showing a minimum configuration example of the data summarizing apparatus. As shown in FIG. 13, the data summarizing apparatus includes a representative approximate expression management unit 1, a total approximate expression storage means 2, and a representative approximate expression storage means 3 as minimum components.

図13に示す最小構成のデータ要約装置において、代表近似式記憶手段3は、データを近似するための近似式を複数記憶する。また、代表近似式管理部1は、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段2が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する機能を備える。また、代表近似式記憶手段3は、代表近似式管理部1が選択した代表近似式を記憶する。   In the data summarizing apparatus with the minimum configuration shown in FIG. 13, the representative approximate expression storage means 3 stores a plurality of approximate expressions for approximating data. Further, the representative approximate expression management unit 1 selects each approximation based on the current time from the approximate expressions stored in the all approximate expression storage means 2 as representative approximate expressions that are candidates for approximating newly generated data. It has a function of selecting an approximate expression that is included in the range of the range that is the range of values that the data can take as the approximate value obtained using the formula. The representative approximate expression storage unit 3 stores the representative approximate expression selected by the representative approximate expression management unit 1.

図13に示す最小構成のデータ要約装置によれば、データの値が突発的に変化する場合に、データの要約の対象とする期間が長くなっても、データの要約を続けることができる。   According to the data summarizing apparatus having the minimum configuration shown in FIG. 13, data summarization can be continued even when the period of data summarization becomes longer when the value of the data suddenly changes.

なお、上記に示した各実施形態では、以下の(1)〜(8)に示すようなデータ要約装置の特徴的構成が示されている。   In each of the embodiments described above, the characteristic configuration of the data summarization apparatus as shown in the following (1) to (8) is shown.

(1)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。   (1) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximation expressions for approximating data. As a representative approximate expression that is a candidate for approximating newly generated data, the approximate expression stored in the all approximate expression storage means is obtained using each approximate expression based on the current time. Representative approximate expression selection means (for example, realized by the representative approximate expression management unit 1) for selecting an approximate expression included in the range of the range where the approximate value is a range of values that the data can take, and representative approximation And a representative approximate expression storage means (for example, realized by the representative approximate expression storage means 3) for storing the representative approximate expression selected by the expression selection means.

(2)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。   (2) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximate expressions for approximating data. As a representative approximate expression that is a candidate for approximating newly generated data, the approximate expression stored in the all approximate expression storage means is obtained using each approximate expression based on the current time. Representative approximate expression selection means (for example, representative approximate expression management unit 1) that selects an approximate expression within the range of values that are values that the data can take and that is within a predetermined number. And a representative approximate expression storage means (for example, realized by the representative approximate expression storage means 3) for storing the representative approximate expression selected by the representative approximate expression selecting means.

(3)データ要約装置は、逐次発生するデータを要約するデータ要約装置であって、データを近似するための近似式を複数記憶する全近似式記憶手段(例えば、全近似式記憶手段2によって実現される)と、新たに発生したデータを近似するための候補となる代表近似式として、全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段(例えば、代表近似式管理部1によって実現される)と、代表近似式選択手段が選択した代表近似式を記憶する代表近似式記憶手段(例えば、代表近似式記憶手段3によって実現される)とを備えたことを特徴とする。   (3) The data summarization device is a data summarization device for summarizing sequentially generated data, and is realized by a total approximation expression storage means (for example, a total approximation expression storage means 2) for storing a plurality of approximate expressions for approximating data. Selected from the multiple approximation formulas stored in the total approximation formula storage means as a representative approximation formula that is a candidate for approximating newly generated data. Representative approximate expression selection means (for example, realized by the representative approximate expression management unit 1) and representative approximate expression storage means for storing the representative approximate expression selected by the representative approximate expression selection means (for example, representative approximate expression storage means 3) It is characterized by the above.

(4)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を代表近似式として選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含むように構成されていてもよい。   (4) In the data summarizing apparatus, the representative approximate expression selecting means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that can be taken by the data, and an all approximate expression storage. An approximate value obtained using each approximate expression based on the current time is included in the range of values indicated by the range information stored in the range storage means from all the approximate expressions stored by the means. First approximation formula selection means (for example, realized by the representative approximation formula first limiting means 11) that selects only the approximation formula and an approximation formula selected by the first approximation formula selection means are predetermined. The second approximate expression selecting means (for example, realized by the representative approximate expression second limiting means 13) for selecting the approximate expression within the predetermined number as the representative approximate expression may be included.

(5)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、近似式が追加されたときに、代表近似式記憶手段が記憶する代表近似式を更新すべきか否かを判定する近似式更新判定手段(例えば、新規近似式追加管理手段21によって実現される)と、近似式更新判定手段によって代表近似式を更新すべきと判定されたときに、代表近似式記憶手段が記憶する代表近似式と、代表近似式記憶手段が記憶する代表近似式を過去に更新したとき以降に追加された近似式との中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式の中から,予め定められた個数以内の近似式を代表近似式として選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含むように構成されていてもよい。   (5) In the data summarization apparatus, the representative approximation formula selection means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that the data can take, and an approximate expression. An approximate expression update determination means for determining whether or not the representative approximate expression stored in the representative approximate expression storage means should be updated (for example, realized by the new approximate expression addition management means 21), and an approximate expression update When the determination means determines that the representative approximate expression should be updated, the representative approximate expression stored in the representative approximate expression storage means and the representative approximate expression stored in the representative approximate expression storage means are added after the past update. Only approximate expressions that are included in the range of values indicated by the range information stored in the range storage means, are approximate values obtained using the approximate formulas based on the current time. Select Of the approximate expressions selected by the first approximate expression selecting means (for example, realized by the representative approximate expression first limiting means 11) and the approximate expression selected by the first approximate expression selecting means, an approximate expression within a predetermined number. The second approximate expression selecting means (for example, realized by the representative approximate expression second limiting means 13) may be included.

(6)データ要約装置において、代表近似式選択手段は、代表近似式記憶手段が使用可能なリソース量を監視する代表近似式リソース監視手段(例えば、代表近似式リソース監視手段31によって実現される)と、代表近似式記憶手段が使用可能なリソース量に基づいて、代表近似式記憶手段に記憶させる代表近似式の個数を決定し、代表近似式記憶手段を更新させる代表近似式更新制御手段(例えば、代表近似式管理制御手段32によって実現される)とを含むように構成されていてもよい。   (6) In the data summarizing device, the representative approximate expression selecting means is representative approximate expression resource monitoring means (for example, realized by the representative approximate expression resource monitoring means 31) for monitoring the resource amount usable by the representative approximate expression storage means. And a representative approximate expression update control means for determining the number of representative approximate expressions to be stored in the representative approximate expression storage means and updating the representative approximate expression storage means (for example, , Realized by the representative approximate expression management control means 32).

(7)データ要約装置において、代表近似式選択手段は、データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段(例えば、値域記憶手段12によって実現される)と、全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて各近似式を用いて求められる近似値が値域記憶手段に記憶されている値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段(例えば、代表近似式第1限定手段11によって実現される)と、第1の近似式選択手段が選択した近似式に基づいて代表近似式を選択する第2の近似式選択手段(例えば、代表近似式第2限定手段13によって実現される)とを含み、第2の近似式選択手段は、第1の近似式選択手段が選択した近似式が予め定められた個数以内であるか否かを判定し、予め定められた個数以内であると判定した場合には、第1の近似式選択手段が選択した近似式をそのまま代表近似式として決定し、予め定められた個数以内でないと判定した場合には、第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を代表近似式として選択するように構成されていてもよい。   (7) In the data summarizing apparatus, the representative approximate expression selecting means includes a range storage means (for example, realized by the range storage means 12) for storing range information indicating a range of values that can be taken by the data, and an all approximate expression storage. An approximate value obtained using each approximate expression based on the current time is included in the range of values indicated by the range information stored in the range storage means from all the approximate expressions stored by the means. A first approximate expression selecting means (for example, realized by the representative approximate expression first limiting means 11) for selecting only the approximate expression and a representative approximate expression based on the approximate expression selected by the first approximate expression selecting means Second approximate expression selection means (for example, realized by the representative approximate expression second limiting means 13) to select, the second approximate expression selection means is the approximate expression selected by the first approximate expression selection means Whether or not is within a predetermined number If it is determined that the number is within the predetermined number, the approximate expression selected by the first approximate expression selecting unit is determined as the representative approximate expression as it is, and if it is determined that the number is not within the predetermined number The approximate expression selected by the first approximate expression selecting means may be configured to select an approximate expression within a predetermined number as the representative approximate expression.

(8)データ要約装置は、代表近似式記憶手段が記憶する各代表近似式を用いてデータを近似する近似手段(例えば、近似手段92によって実現される)を備え、近似手段は、代表近似式記憶手段が記憶する各代表近似式を用いて算出した近似値と実データの値との誤差に基づいて、代表近似式記憶手段が記憶する各代表近似式の中から、データの近似に用いる近似式を決定する近似式決定手段(例えば、近似式計算手段921によって実現される)と、代表近似式記憶手段が記憶する各代表近似式の中にデータの近似に使用可能な近似式がない場合に、新たに近似式を生成する近似式生成手段(例えば、新規近似式生成手段924によって実現される)とを含むように構成されていてもよい。   (8) The data summarizing apparatus includes approximation means (for example, realized by the approximation means 92) for approximating data using each representative approximation expression stored in the representative approximation expression storage means. Based on the error between the approximate value calculated using each representative approximate expression stored in the storage means and the value of the actual data, the approximation used for data approximation from the representative approximate expressions stored in the representative approximate expression storage means When there is no approximate expression that can be used to approximate the data in the approximate expression determining means (for example, realized by the approximate expression calculating means 921) for determining the expression and each representative approximate expression stored in the representative approximate expression storing means In addition, an approximate expression generation unit (for example, realized by the new approximate expression generation unit 924) that newly generates an approximate expression may be included.

本発明は、近似式による近似処理を用いてデータを要約するデータ要約装置の用途に好適に適用可能である。   The present invention can be suitably applied to the use of a data summarization apparatus that summarizes data using an approximation process using an approximate expression.

1 代表近似式管理部
2 全近似式記憶手段
3 代表近似式記憶手段
11 代表近似式第1限定手段
12 値域記憶手段
13 代表近似式第2限定手段
21 新規近似式追加管理手段
31 代表近似式リソース監視手段
32 代表近似式管理制御手段
91 データ入力手段
92 近似手段
95 近似式更新手段
921 近似式計算手段
922 出力手段
923 未確定データ記憶手段
924 新規近似式生成手段
1 Representative approximation formula management department
2 All approximation formula storage means
3 Representative approximation formula storage means
11 Representative approximation formula 1st limiting means
12 Range storage means
13 Representative approximation formula second limiting means
21 New approximation formula addition management means
31 Representative approximate resource monitoring means
32 Representative approximate expression management control means
91 Data input means
92 Approximate means
95 Approximation formula update method
921 Approximation formula calculation means
922 Output means
923 Indeterminate data storage means
924 New approximate expression generation means

Claims (10)

逐次発生するデータを要約するデータ要約装置であって、
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれている近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。
A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. Representative approximate expression selecting means for selecting an approximate expression included in a range of a value range that can be taken by data;
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
逐次発生するデータを要約するデータ要約装置であって、
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。
A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. Representative approximate expression selection means for selecting an approximate expression that is included in a range of values that can be taken by the data and that is within a predetermined number,
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
逐次発生するデータを要約するデータ要約装置であって、
データを近似するための近似式を複数記憶する全近似式記憶手段と、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する複数の近似式の中から、予め定められた個数以内の近似式を選択する代表近似式選択手段と、
前記代表近似式選択手段が選択した前記代表近似式を記憶する代表近似式記憶手段と
を備えたことを特徴とするデータ要約装置。
A data summarization device for summarizing sequentially generated data,
All approximate expression storage means for storing a plurality of approximate expressions for approximating data;
Representative approximate expression for selecting an approximate expression within a predetermined number from a plurality of approximate expressions stored in the all approximate expression storage means as a representative approximate expression to be a candidate for approximating newly generated data A selection means;
A data summarizing apparatus comprising: a representative approximate expression storing means for storing the representative approximate expression selected by the representative approximate expression selecting means.
前記代表近似式選択手段は、
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
前記全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を前記代表近似式として選択する第2の近似式選択手段とを含む
請求項1から請求項3のうちのいずれか1項に記載のデータ要約装置。
The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
A value indicated by the range information stored in the range storage means is an approximate value obtained by using each approximation formula based on the current time among all the approximate formulas stored in the total approximation formula storage means First approximation formula selection means for selecting only the approximation formula included in the range of
The second approximate expression selecting means for selecting, as the representative approximate expression, an approximate expression within a predetermined number from the approximate expressions selected by the first approximate expression selecting means. 4. The data summarization device according to any one of 3.
前記代表近似式選択手段は、
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
近似式が追加されたときに、前記代表近似式記憶手段が記憶する前記代表近似式を更新すべきか否かを判定する近似式更新判定手段と、
前記近似式更新判定手段によって前記代表近似式を更新すべきと判定されたときに、前記代表近似式記憶手段が記憶する前記代表近似式と、前記代表近似式記憶手段が記憶する前記代表近似式を過去に更新したとき以降に追加された近似式との中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式の中から,予め定められた個数以内の近似式を前記代表近似式として選択する第2の近似式選択手段とを含む
請求項1から請求項3のうちのいずれか1項に記載のデータ要約装置。
The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
Approximate expression update determination means for determining whether or not the representative approximate expression stored in the representative approximate expression storage means should be updated when an approximate expression is added;
The representative approximate expression stored in the representative approximate expression storage means and the representative approximate expression stored in the representative approximate expression storage means when the approximate expression update determination means determines that the representative approximate expression should be updated. The approximate value obtained by using each approximate expression based on the current time from the approximate expressions added after the time is updated in the past is indicated by the range information stored in the range storage means. A first approximation formula selection means for selecting only the approximation formula included in the value range;
The second approximate expression selecting means for selecting, as the representative approximate expression, an approximate expression within a predetermined number from the approximate expressions selected by the first approximate expression selecting means. 4. The data summarization device according to any one of 3.
前記代表近似式選択手段は、
前記代表近似式記憶手段が使用可能なリソース量を監視する代表近似式リソース監視手段と、
前記代表近似式記憶手段が使用可能なリソース量に基づいて、前記代表近似式記憶手段に記憶させる前記代表近似式の個数を決定し、前記代表近似式記憶手段を更新させる代表近似式更新制御手段とを含む
請求項1から請求項4のうちのいずれか1項に記載のデータ要約装置。
The representative approximate expression selection means includes:
Representative approximate expression resource monitoring means for monitoring the amount of resources that can be used by the representative approximate expression storage means;
Based on the amount of resources that can be used by the representative approximate expression storage means, the representative approximate expression update control means for determining the number of the representative approximate expressions to be stored in the representative approximate expression storage means and updating the representative approximate expression storage means The data summarization device according to any one of claims 1 to 4.
前記代表近似式選択手段は、
データがとりうる値の範囲を示す値域情報を記憶する値域記憶手段と、
前記全近似式記憶手段が記憶する全ての近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が前記値域記憶手段に記憶されている前記値域情報で示される値の範囲内に含まれている近似式のみを選択する第1の近似式選択手段と、
前記第1の近似式選択手段が選択した近似式に基づいて前記代表近似式を選択する第2の近似式選択手段とを含み、
前記第2の近似式選択手段は、
前記第1の近似式選択手段が選択した近似式が予め定められた個数以内であるか否かを判定し、
予め定められた個数以内であると判定した場合には、前記第1の近似式選択手段が選択した近似式をそのまま前記代表近似式として決定し、
予め定められた個数以内でないと判定した場合には、前記第1の近似式選択手段が選択した近似式の中から、予め定められた個数以内の近似式を前記代表近似式として選択する
請求項1から請求項6のうちのいずれか1項に記載のデータ要約装置。
The representative approximate expression selection means includes:
Range storage means for storing range information indicating the range of values that the data can take;
A value indicated by the range information stored in the range storage means is an approximate value obtained by using each approximation formula based on the current time among all the approximate formulas stored in the total approximation formula storage means First approximation formula selection means for selecting only the approximation formula included in the range of
A second approximate expression selecting means for selecting the representative approximate expression based on the approximate expression selected by the first approximate expression selecting means,
The second approximate expression selecting means is
Determining whether the approximate expression selected by the first approximate expression selecting means is within a predetermined number,
When it is determined that the number is within a predetermined number, the approximate expression selected by the first approximate expression selection unit is determined as the representative approximate expression as it is,
If it is determined that the number is not less than a predetermined number, an approximate expression within a predetermined number is selected as the representative approximate expression from the approximate expressions selected by the first approximate expression selection unit. The data summarization device according to any one of claims 1 to 6.
前記代表近似式記憶手段が記憶する前記各代表近似式を用いてデータを近似する近似手段を備え、
前記近似手段は、
前記代表近似式記憶手段が記憶する前記各代表近似式を用いて算出した近似値と実データの値との誤差に基づいて、前記代表近似式記憶手段が記憶する前記各代表近似式の中から、データの近似に用いる近似式を決定する近似式決定手段と、
前記代表近似式記憶手段が記憶する前記各代表近似式の中にデータの近似に使用可能な近似式がない場合に、新たに近似式を生成する近似式生成手段とを含む
請求項1から請求項7のうちのいずれか1項に記載のデータ要約装置。
Approximating means for approximating data using each representative approximate expression stored in the representative approximate expression storing means;
The approximation means includes
Based on the error between the approximate value calculated using each representative approximate expression stored in the representative approximate expression storage means and the value of the actual data, the representative approximate expression stored in the representative approximate expression storage means Approximation expression determining means for determining an approximation expression used for data approximation;
The approximate expression generation means for newly generating an approximate expression when there is no approximate expression usable for data approximation in the representative approximate expressions stored in the representative approximate expression storage means. Item 8. The data summarization device according to any one of items 7 to 9.
逐次発生するデータを要約するデータ要約方法であって、
データを近似するための近似式を全近似式記憶手段に複数記憶し、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択し、
選択した前記代表近似式を代表近似式記憶手段に記憶する
ことを特徴とするデータ要約方法。
A data summarization method for summarizing sequentially generated data,
A plurality of approximation formulas for approximating data are stored in all approximation formula storage means,
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. , Select an approximate expression that is included in the range of values that can be taken by the data, and within a predetermined number,
A data summarizing method, wherein the selected representative approximate expression is stored in a representative approximate expression storage means.
逐次発生するデータを要約するためのデータ要約プログラムであって、
データを近似するための近似式を複数記憶する全近似式記憶手段を備えたコンピュータに、
新たに発生したデータを近似するための候補となる代表近似式として、前記全近似式記憶手段が記憶する近似式の中から、現在時刻に基づいて前記各近似式を用いて求められる近似値が、データがとりうる値の範囲である値域の範囲内に含まれており、且つ予め定められた個数以内の近似式を選択する処理と、
選択した前記代表近似式を代表近似式記憶手段に記憶させる処理と
を実行させるためのデータ要約プログラム。
A data summarization program for summarizing sequentially generated data,
In a computer provided with all approximate expression storage means for storing a plurality of approximate expressions for approximating data,
As a representative approximate expression that becomes a candidate for approximating newly generated data, an approximate value obtained by using each approximate expression based on the current time is selected from the approximate expressions stored in the all approximate expression storage means. A process of selecting an approximate expression that is included in a range of values that can be taken by the data and that is within a predetermined number;
A data summarization program for executing the process of storing the selected representative approximate expression in the representative approximate expression storage means.
JP2010002488A 2010-01-08 2010-01-08 Apparatus, method and program for data summarization Pending JP2011141777A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010002488A JP2011141777A (en) 2010-01-08 2010-01-08 Apparatus, method and program for data summarization

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010002488A JP2011141777A (en) 2010-01-08 2010-01-08 Apparatus, method and program for data summarization

Publications (1)

Publication Number Publication Date
JP2011141777A true JP2011141777A (en) 2011-07-21

Family

ID=44457564

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010002488A Pending JP2011141777A (en) 2010-01-08 2010-01-08 Apparatus, method and program for data summarization

Country Status (1)

Country Link
JP (1) JP2011141777A (en)

Similar Documents

Publication Publication Date Title
US11568300B2 (en) Apparatus and method for managing machine learning with plurality of learning algorithms and plurality of training dataset sizes
US20160321331A1 (en) Device and method
US20180144251A1 (en) Server and cloud computing resource optimization method thereof for cloud big data computing architecture
US10423902B2 (en) Parallel processing apparatus and method of estimating power consumption of jobs
JP6327234B2 (en) Event analysis device, event analysis system, event analysis method, and event analysis program
US20090077235A1 (en) Mechanism for profiling and estimating the runtime needed to execute a job
US20140298321A1 (en) Installation control method and installation control apparatus
US10552460B2 (en) Sensor data management apparatus, sensor data management method, and computer program product
EP3413197A1 (en) Task scheduling method and device
CN105491079B (en) Method and device for adjusting resources required by application in cloud computing environment
US11651271B1 (en) Artificial intelligence system incorporating automatic model updates based on change point detection using likelihood ratios
JP2008305402A (en) Method, computer program and system for identifying instruction to obtain representative trace
US20120317069A1 (en) Throughput sustaining support system, device, method, and program
CN110968802B (en) Analysis method and analysis device for user characteristics and readable storage medium
WO2017188419A1 (en) Computational resource management device, computational resource management method, and computer-readable recording medium
JPWO2012176923A1 (en) Anonymization index determination device and method, and anonymization processing execution system and method
JPWO2014199920A1 (en) Prediction function creation device, prediction function creation method, and program
JPWO2016178316A1 (en) Computer procurement forecasting apparatus, computer procurement forecasting method, and program
JP2019212043A (en) Computer system and learning control method
US20240303134A1 (en) Systems and methods for edge resource demand load estimation
US20240305535A1 (en) Systems and methods for edge system resource capacity dynamic policy planning framework
US20240303130A1 (en) Systems and methods for edge resource demand load scheduling
JPWO2015141218A1 (en) Information processing apparatus, analysis method, and program recording medium
JP2020154934A (en) Power consumption prediction program, power consumption prediction method, and power consumption prediction device
JPWO2011016281A1 (en) Information processing apparatus and program for Bayesian network structure learning