WO2005083890A1

WO2005083890A1 - 時系列データ次元圧縮装置

Info

Publication number: WO2005083890A1
Application number: PCT/JP2004/002252
Authority: WO
Inventors: Shigenobu Takayama; Shinsuke Azuma; Shigeo Sato
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 2004-02-26
Filing date: 2004-02-26
Publication date: 2005-09-09
Anticipated expiration: 2006-08-26
Also published as: JP4298749B2; CA2548461A1; JPWO2005083890A1; CA2548461C; US20070147519A1; CN1894856A; US7433527B2

Abstract

　時系列データ次元圧縮装置に係り、データの特徴を失わずに、時系列データの検索の効率をよくする次元圧縮を行うことを課題とする。また、決まった次元に圧縮し、そのなかにより多くの情報を抽出できるようにする。部分時系列作成部１１２は、時系列データ作成部１１０で生成した複数の時系列データについて、指定のセグメント幅に分割した部分時系列を作成する。特異値分解実行部１１３は、全ての部分時系列を対象として特異値分解を行い、次元圧縮時系列データ生成部１１４は、上位の特異値分解の成分を、部分時系列の代表値として次元圧縮時系列データを生成する。

Description

明細書時系列データ次元圧縮装置技術分野

本発明は、時系列データの検索をより効率よく行うために、データの特徴を失わずに次元圧縮することを目的とする。また、圧縮効率をよくすることを目的とするのではなく、決まった次元に圧縮し、そのなかにより多くの情報を抽出することを目的とする。背景技術

時系列データの次元を減らす従来技術としては、例えば

E . K e o g h , K. Ch a k r a b a r t i , M. P a z z a n i ， Me r o t r a

"D i me n s i o n a l i t y Re du c t i o n f o r F a s t S i m i l a r i t y S e a r c h i n L a r g e T i me S e r i e s D a t a b a s e s . J o u n a 1 o f K n o w 1 e d g e a n d I n f o rma t i o n S y s t ems ， 2000

に示されている P AA (P i e s ew i s e Ag g r e g a t e A p p r o x ima t i o n) がある。

PA Aでは、時系列データをセグメントに分割し、セグメントの平均値を各セグメントの代表値とすることで、時系列データを圧縮するものである。

平均値の計算はフーリエ変換や特異値分解に比べて簡単に実行でき、より高速に次元圧縮時系列データを生成することができる。時系列データの次元を減らす他の従来技術としては、例えば、 F . K o r η , H. V. J a g a d i s , C . F a l o u t s o s" E f f i c i e n t y S u p p o r t i n g Ad Ho c Q u e r i e s i n L a r e D a t a s e t s o f T i me S e q u e n c e s"

P r o c e e d i n g s o f S I GMOD ' 97 p p 289 - 300

に示されている特異値分解による方法もある。特異値分解による方法では、特異値分解後の全ての成分を用いるのではなく、主要な特異値（特異値の大きいもの）のみを採用することで時系列データを圧縮するものである。

特異値分解により次元を圧縮すると、データの形状を他の方法よりうまく抽出できるため、検索効率がよいという利点がある。

また、画像データの次元を減らす従来技術としては、例えば特開昭 6 1 - 285870 「変換符号化方式」がある。画像データをブロックに分割してブロックとに圧縮する。分割したブロックの圧縮では、 DCT (D i s c r e t e C o s i n e T r a n s f o rm) と行歹 !Jの縦 •横の傾斜角度をあらわす変換との組合せを用いる。

このように 2つの変換を組み合わせることで、ブロックごとにその特徴を抽出して最適な変換を選択することでより高い圧縮率を実現できる

PAAは、各セグメントの平均値を代表値とすることで、より高速に次元圧縮ができるが、時系列データの検索時または類似検索時には次のような問題がある。時系列データの検索手順は、まず圧縮空間で解の候補を探し、各解の候補に対して実空間で最終的な解を検索する。したがつて、圧縮空間では解の候補として選択されたが実空間で真の解とならないものが多いと検索効率が悪くなる。 P A Aの場合は平均値を各セグメントの代表値とするために、時系列の形状が消されるため圧縮後の情報が乏しくなり、上記で言う検索効率が悪いという問題がある。例えば、平らな時系列も右上がりの時系列も右下がりの時系列も平均値が同じになると、圧縮後の値は同じとなってしまう。

S V Dは、特異値分解によりデータの形状をうまく抽出でき、上記で言う検索効率は高いものの、データ量が多くなると特異値分解にかかる時間が多くなり現実的な時間では特異値分解ができないという問題がある。

特開昭 6 1 - 2 8 5 8 7 0 「変換符号化方式」は、圧縮率を向上することが目的であるが、時系列データの検索に用いる場合には以下の問題がある。時系列データの検索はまず解の候補を圧縮空間で探すために、全てのセグメント（ブロック）を同じ圧縮率で圧縮する必要があるが、上述の方式では各ブロックごとに異なる圧縮率となる。発明の開示

本発明に係る時系列データ次元圧縮装置は、

以下の要素を有することを特徴とする

( 1 ) 時間軸に沿って一定間隔で測定された一連のデータである時系列元データに対して、時間軸上で所定間隔ずつ開始位置をずらして、指定の長さの時系列データを複数作成する時系列データ作成部

( 2 ) 複数の上記時系列データのそれぞれについて、指定のセグメント幅に分割した部分時系列を作成する部分時系列作成部

( 3 ) 上記分割した全ての部分時系列を対象として特異値分解を行う特異値分解実行部

( 4 ) 指定された数の上位の特異値分解の成分を、上記各セグメント幅に分解した部分時系列の代表値として、次元圧縮時系列データを生成する次元圧縮時系列データ生成部。図面の簡単な説明

図 1は、この発明の実施の形態 1を示す構成図である。

図 2は、時系列元データ 1 50を表したグラフである。

図 3は、時系列デ一夕 1 5 1の作成方法の図である。

図 4は、時系列データ 15 1の作成のためのフローチヤ一トである。図 5は、時系列デ一夕 15 1のグラフである。

図 6は時系列デ一夕をセグメントに分割した様子を示したものである図 7は、開始位置 t =k + 2Nの部分時系列 1 52を示したものである。

図 8は、 kから始まる時系列 1 5 1と k + 2 Nから始める時系列 25 1を示したものである。

図 9は、 S VD実行結果記憶部の内容で特異値分解の結果を示す図である。

図 10は、代表値をプロットした次元圧縮時系列データ 1 53のダラフの例である。

図 1 1は、圧縮データ作成のフローチャートである。

図 12は、この発明の実施の形態 2を示す構成図である。

図 1 3は、実施の形態 2のフローチャートである。

図 14は、セグメント幅を 16にした場合と 32にした場合の模式図である。

図 1 5は、 SVDの結果の第 2成分まで用いる場合の SVD実行結果である。図 16は、この発明の実施の形態 3を示す構成図である。

図 1 7は、平均値計算実行部 182の計算結果を模式的に新たしたものである。

図 1 8は、中間時系列のグラフである。

図 1 9は、圧縮後の次元を 8次元にする場合の SVD実行結果である図 20は、ハードウェア構成図である。発明を実施するための最良の形態

実施の形態 1.

図 1は、この発明の実施例を示す構成図である。図において、 120 は 2次記憶装置もしくは 1次記憶装置で、時系列元データ 1 50を格納した時系列元データ格納部である。時系列データ作成部 1 1 0は、時系列元データ格納部 1 20から時系列元データ 1 50を読み込み、時系列データ 1 5 1を作成する。 121は 2次記憶装置もしくは 1次記憶装置で 1 10によって生成された複数の時系列データ 1 5 1を格納する時系列データ格納部である。部分時系列作成部 1 1 2は、時系列データ格納部 12 1から時系列デ一夕 1 5 1を順次読込み、部分時系列 1 52を作成し、部分時系列記憶部 1 22に格納する。部分時系列記憶部 1 22は、 1次記憶装置もしくは 2次記憶装置である。 3 0実行部1 13は、部分時系列記憶部 122から部分時系列 1 52を読込み特異値分解を実行し、 SVD実行結果記憶部 124に格納する。 SVD実行結果記憶部 124は、 1次記憶装置もしくは 2次記憶装置である。次元圧縮時系列データ生成部 1 14は、 S VD実行結果記憶部 124から S VDの結果を読込み、次元圧縮時系列データ 1 53を作成し、次元圧縮時系列デー夕格納部 123に格納する。次元圧縮時系列データ格納部 1 23は、 2 次記憶装置もしくは 1次記憶装置である。

図 2は、時系列元データ 150を表したグラフである。 X軸が時刻 t 、 y軸が時系列の値である。時刻 tの取りうる値は 1から mの間の自然数であり、 m個のデータポイントがある。最初のデータポイントは t = 1であらわし、最後のデータポイントは t=mとする。また、データポイン卜の数を長さと呼び、この場合の長さは m (時系列長 160) である。

図 3は、時系列データ 151の作成方法の図である。時系列データ作成部 1 10は、時系列元データ格納部 120から時系列元データ 150 を読み込み、長さ nの時系列を時系列元データの開始ポイントの時刻 t を一つづつずらすことで、 m— n+1個作成する。ここでは、長さ nはあらかじめ決めておくこととする。 t = 1から始める時系列が時系列 1 、 t = 2から始める時系列が時系列 2、そして t =m— n+ 1から始める時系列が時系列 m— n+ 1である。 t =m— n+1から始める時系列の終点は t=mとなり、これ以降の tの値から始めると長さが n未満となる。

さらに、部分時系列作成のことを考慮し、長さが n未満で N以上の時系列をその後に n—N個追加する。これを補填時系列とよぶ。開始時刻 tの値が、 m— n + 2から m— N+ 1までの時系列であり、終点の tの値は全て mである。

m— n'+ 2から始まる時系列は、長さが n— 1であり、

m— n+ 3から始まる時系列は、長さが n— 2であり、

m_N+ 1から始まる時系列は、長さが Nである。

図 4は、時系列データ 151の作成のためのフローチャートである。 S 301にて、時系列元データにて時系列データの開始時刻 t = 1にセットする。 S 302においては、時系列長 =nにセットする。 S 303 にて、時系列元データを読み込む。 S 3 0 4では、時系列開始時刻と時系列長から時系列終了ポイントを計算し、 m以下であるか調べる。時系列終了ポイントが m以下であれば時系列デ一夕を作成できるので、 S 3 0 5にすすむ。 S 3 0 5にて時系列開始時刻と時系列長をもとに、時系列元デ一夕から時系列データを作成する。 S 3 0 6では次の時系列デー夕を作成するために開始ポイント tをインクリメントして、再ぴ S 3 0 3に戻る。 S 3 0 4にて、時系列の終了ポイントが mを超えている場合は、時系列長 nの時系列データはこれ以上作成できないので、補填時系列データを作成するために S 3 0 8にすすむ。 S 3 0 8では、時系列長をデイクリメントする。 S 3 0 9では、デイクリメントして時系列長が N以上であるか調べる。 N以上であれば、 S 3 1 0にすすみ補填時系列データを作成する。 S 3 1 1では、開始ポイントをインクリメントして次の補填時系列データを作成するための準備をして、 S 3 0 7にすすむ。 S 3 0 7では時系列元デ一夕を読み込む。次に再び S 3 0 8にすすむ。 S 3 0 9にて、時系列長が Nより小さくなつたら時系列データ作成は終了する。

図 5は、時系列データ 1 5 1のグラフである。開始位置は k、終了位置が k + n— 1で n個のデータポイントで構成される。時系列データ 1 5 1は長さが n (検索時系列長 1 6 1 ) の時系列である。

図 6は時系列データをセグメントに分割した様子を示したものである。各時系列データ 1 5 1を長さ N (セグメント幅 1 6 2 ) のセグメントに分割する。一つの時系列データ 1 5 1は n ZN 個のセグメントに分割される。それぞれの長さ Nのセグメントを部分時系列 1 5 2とする図 7は、開始位置 t = k + 2 Nの部分時系列 1 5 2をあらわす。部分時系列 1 5 2は N個のデータポイントから構成され、長さは Nである。部分時系列作成部 1 1 2は、それぞれの時系列データ 1 5 1の最初の N個のデータのみを選択することで、部分時系列データ 1 5 2を作成する。全ての時系列に対して実行することで開始位置が t = 1から t =m _ n + 1の長さ Nの部分時系列を作成できる。さらに、時系列データ作成部 1 1 0が作成した補填時系列についても最初の N個のデータを読み込みそれも補填部分時系列データとして作成し、あわせて部分時系列記憶部 1 2 2に格納する。ここでセグメント幅 Nはあらかじめ決めておくこととする。上記のようにすることで、時系列元データに対して、開始位置 t = 1カゝら t =m— N + 1までの長さ Nの全ての部分時系列を作成できる。

全ての時系列データがもともとは一つの時系列元データ 1 5 0であつたことから、各時系列データのいずれのセグメントも上記の部分時系列のいずれかと一致する。

図 8に示すように、 kから始まる時系列 1 5 1の 3番目のセグメントの部分時系列は、 k + 2 Nから始める時系列 2 5 1の最初のセグメントと同じである。つまり、時系列 2 5 1から作成した部分時系列と一致する。

S V D実行部 1 1 3は、部分時系列作成部 1 1 2から部分時系列デー夕 1 5 2を読込み、行数 m _ N + l、列数 Nの行列として特異値分解を実行する。

特異値分解とは、任意の m X n行列 Yを、以下のように U， S， Vの 3 つの行列の積で表わすもので一般に良く知られている式である。

Y = USV + s₂u₂v₂ +■■ " + S,U ,V,

ただし、 r = r a nk (Y) ，

^S ! ， ^S 2 ： , …， s は Υ^τ Y の正の固有値の平方根（特異値という）で、 S ≥ S S ,

1 2 … ≤ r

, …， V

r は η 次のベクトルで、 Υ^τ Υ の固有値 s _ι ， s 2² ， '··, s r ² に対応する固有ベクトル。

, ···, V

r は大きさが 1 で互いに直交する。

^U ! ， ^U 2 , …， u r は m 次のべクトルで、 ^uj りで定義される。

u は， u 2 ， …， u r を列にもつ m X r 行列

V はェ， v ·

2 ， ··, V

r を列にもつ n X r 行列

S は s i , s _o ， …， s を対角要素にもつ r 次の対角行列。

図 9は、 SVD実行結果記憶部の内容で特異値分解の結果を示す。特異値分解により、各行の代表値として上記 _Ml を抽出する。

すなわち特異値分解の対象となる行数 m— N+ 1列数 Nの行列に対して、行方向で見た場合に、 r番目の行は u 1ベクトルの r番目の成分と s 1の積を代表値とする。

r番目の行は、開始位置の t = rで始まる部分時系列であり、その代表値が u 1べクトルの r番目の成分と s 1の積である。 S VD実行部は、全てのセグメント（全ての部分時系列）の代表値を作成する。

次に、次元圧縮時系列データ生成部は 1 14 は、上記の特異値分解の第一成分を各セグメントの代表値として、次元圧縮時系列データを生成する。開始位置 t =kで始まる部分時系列 1 5 1は、以下の部分時系列で構成される。

開始位置 t =k、 k+N, k + 2N， ···。

したがって、その次元圧縮時系列データは、最初の代表値は u lベタトルの k番目の成分と s 1の積であり、次の代表値は u 1ベクトルの k + N番目の成分と s 1の積である。

図 10は、上記の代表値をプロットした、次元圧縮時系列データ 1 5 3のグラフの例である。

次元圧縮時系列データ 1 53は nZN個のポイントで構成される。時系列データ 1 5 1をセグメント分割したそれぞれの部分時系列データにたいして、 SVDを実行してその第一成分をプロットしたものである。図 1 1は、圧縮データ作成のフローチャートである。時系列データ作成部 1 10は、時系列元データ格納部 120から時系列元データ 1 50 を読み込み、時系列データ 1 5 1を作成し、時系列データ格納部 12 1 に格納する。次に、部分時系列作成部 1 1 2は、時系列データ格納部 1 2 1から時系列データ 1 5 1を順次読込み、部分時系列 1 52を作成し、部分時系列記憶部 1 22に格納する。次に、 SVD実行部 1 1 3は、部分時系列記憶部 1 22から部分時系列を読込み特異値分解を実行し、 SVD実行結果記憶部 1 24に格納する。次元圧縮時系列データ生成部 1 14は、 SVD実行結果記憶部 124のデータを用いて次元圧縮時系列データ 1 53を作成し、次元圧縮時系列デ一夕格納部 12.3に格納する。

上述のように時間軸に沿って一定間隔で測定された一連のデータに対して、指定の長さの時系列データを時間軸上で開始位置をずらして複数作成する手段と、上記指定の長さの各時系列データを指定のセグメント幅に分割した部分時系列を作成する手段と、上記分割した全ての部分時系列を対象として特異値分解を行う手段と、指定された数の上位の特異値分解の成分（この場合は第一成分までとした）を上記各セグメント幅に分解した部分時系列の代表値とする手段と、上記代表値を組み合わせることで上記指定の長さの時系列データの次元を圧縮する手段とを備えたことを特徴とする時系列データ次元圧縮方式について説明した。実施の形態 2.

図 1 2は、この発明の実施例を示す構成図である。 1 1 0、 1 12、 1 1 3、 1 14、 120、 12 1、 122、 1 23、 1 24は図 1と同様である。データ解析部 1 1 7は、時系列データ格納部 1 2 1から時系列データ 1 5 1を読み込み解析し、セグメント幅と特異値分解の結果のどの成分までを有効とするかを決めるものである。

図 13は実施の形態 2のフローチャートである。時系列データ作成部 1 10は、時系列元データ格納部 120から時系列元デ一夕 1 50を読み込み、時系列デ一夕 1 5 1を作成し、時系列データ格納部 1 2 1に格納する。

次に、データ解析部 1 1 7は時系列データ格納部 1 2 1から時系列デ一夕を読込み解析を行う。解析の結果、検索時にヒット率が最も高くなるように、セグメント幅と特異値分解の結果のどの成分までを有効とするかを決める。この場合は、第 2成分までを使用することとする。部分時系列作成部 1 1 2は、時系列データ格納部 12 1から時系列デ一夕 1 5 1を順次読込み、部分時系列 1 52を作成し、部分時系列記憶部 122に格納する。この際に、部分時系列のセグメント幅はデータ解析部 1 17が決めた値とする。次に、 SVD実行部 1 1 3は、部分時系列記憶部 122から部分時系列を読込み特異値分解を実行する。実行した結果、 SVDの結果のどの成分までを採用するかデータ解析部 1 1 7 が決めた値までを S V D実行結果記憶部に記憶する。この場合は第 2成分までを SVD実行結果記憶部に格納する。次元圧縮時系列データ生成部 1 14は、 SVD実行結果記憶部の内容を用いて次元圧縮時系列デー夕 1 53を作成し、次元圧縮時系列データ格納部 1 23に格納する。図 14は、セグメント幅を 16にした場合と 32にした場合の模式図である。セグメント幅を 16にして、 S VDの第 1成分まで使用した場合の圧縮後の次元は、以下より求まる。

セグメント数 128÷16=8、セグメント代表値 = 1

セグメント数 Xセグメント代表値 = 8

すなわち 8次元に圧縮できる。

一方、セグメント幅を 32にして、 SVDの第 2成分まで使用した場合の圧縮後の次元は、以下より求まる。

セグメント数 128÷32=4、セグメント代表値 =2

セグメント数 Xセグメント代表値二 8

すなわち 8次元に圧縮できる。

圧縮後の次元を同じにする場合でも、セグメント幅とセグメント代表値の取り方にはいくつかの選択肢があり、そのなかでもっともヒット率が高くなるようにセグメント幅とセグメント代表値の数をきめるのがデ一夕解析部 1 17の機能である。

図 1 5は、 SVDの結果の第 2成分まで用いる場合の SVD実行結果記憶部の内容である。セグメントの第 1成分が全セグメン卜でほぼ同じ値の場合には、セグメント幅を長くして SVDの第 2成分までを利用することでより詳細に時系列データの特徴を抽出でき、検索時のヒット率が向上する。

時系列データを解析して、上記時系列データを分割するセグメント幅および特異値分解のどの成分までを利用して上記部分時系列の代表値とするかを判断する手段をそなえた請求項 1記載の時系列データ次元圧縮方式について説明した。

以上のように、この発明によれば、セグメント分割して SVDを実行することで、全データと比較した各セグメントの特徴を抽出できるために、検索効率の高い圧縮データを作成できる。また、単純に SVDを実行する場合に比べると、対象となる行列の行数は同じであるが列数が N /n になるためにより高速に実行できる。実施の形態 3.

図 16は、この発明の実施例を示す構成図である。図において、 1 1

0、 1 14、 1 20、 12 1、 123、 1 24は図 1と同様である。中間次元決定部 181は、平均値を計算するための幅を決定する。平均値計算実行部 182は中間次元決定部の指定した平均値幅で時系列データの平均値を計算し、結果を平均値計算結果記憶部 1 9 1に格納する。中間時系列作成部 183は、平均値幅の代表値をその平均値とすることで中間時系列 1 55を作成して、中間時系列記憶部 1 92に格納する。 S VD実行部 1 1 3は、中間時系列記憶部 192に対して、特異値分解を実行する。

中間次元決定部 181は、時系列元データを読込み解析して、中間次元 pおよび平均をとるセグメント幅を決定する。平均をとる幅は、時系列データが単調に増加または減少する範囲内とする。

図 1 7は、平均値計算実行部 182の計算結果を模式的に新たしたものである。時系列 1 51の長さを nとし、中間次元を pとすると、平均をとるセグメント幅は nZpとなる。例えば、時系列長が 1 28で中間次元が 32の場合は、平均をとるセグメント幅は 128 32 = 4となる。平均値計算実行部 182は、時系列元データ 1 50に対して開始時刻 tを一つづつずらしながら、データボイントごとに平均値を計算して結果を平均値計算結果記憶部 1 9 1に格納する。

図 1 8は、中間時系列のグラフである。中間時系列作成部 1 8 3は、各時系列 1 5 1を平均をとるセグメント幅に分解し、それぞれの代表値を平均値計算結果記憶部 1 9 1の内容から取り出して、中間時系列 1 5 5を作成して、中間時系列記憶部 1 9 2に格納する。

図 1 9は、圧縮後の次元を 8次元にする場合の S V D実行結果記憶部 1 2 4の内容である。 S V D実行部 1 1 3は、中間時系列記憶部 1 9 2 から中間時系列 1 5 5を読込み、行数 m— n + l、列数 pの行列として特異値分解を実行し、結果を S V D実行結果記憶部 1 2 4に格納する。圧縮後の次元を 8次元にするために、第 8成分の値までを格納している次に、次元圧縮時系列データ生成部は 1 1 4 は、上記の特異値分解の第 8成分までを用いて次元圧縮時系列データを生成する。すなわち、各時系列 1 5 1は以下の 8つのデータで近似的に表し、次元圧縮時系列データを生成する。

( S J u ₁ , s ₂ u ₂ , S 3 u _{3 >} s , u _Λ , s ₅ u _s, s ₆ u ₆, s ₇ u ₇ , s ₈ u ₈)

指定の長さの複数の時系列デ一夕に対して、平均をとるセグメント幅を決める手段と、上記の各時系列に対して平均をとるセグメント幅ごとに平均値を計算する手段と、平均値をセグメント代表値とした中間時系列を作成する手段と、それぞれの中間時系列を対象として特異値分解を行う手段と、指定された数の上位の特異値分解の成分を上記中間時系列の圧縮データとする手段とを備えたことを特徴とする時系列データ次元圧縮方式について説明した。

以上のように、この発明によれば、時系列データが単調に変化する幅で平均値をとることでデータの特質を失うことなくデータ量を削減できる。さらに、削減したデータ量に対して S V Dを実行することで高速に特異値分解を実行でき、またデータの特徴も抽出することができる。時系列データ次元圧縮装置は、コンピュータであり、各要素はプログラムにより処理を実行することができる。また、プログラムを記憶媒体に記憶させ、記憶媒体からコンピュー夕に読み取られるようにすることができる。

図 2 0は、時系列データ次元圧縮装置のハードウェア構成例を示す図である。この例では、バスに、演算装置 2 0 0 1、メモリ 2 0 0 2、ハードディスク 2 0 0 3、表示装置 2 0 0 4が接続されている。プロダラムは、例えばハードディスク 2 0 0 3に記憶されており、メモリ 2 0 0 2にロードされた状態で、順次演算装置 2 0 0 1に読み込まれ処理を行ラ。産業上の利用可能性

データの特徴を失わずに、時系列データの検索の効率をよくする次元圧縮を行うことができる。また、決まった次元に圧縮し、そのなかにより多くの情報を抽出することがでる。

Claims

請求の範囲

1 . 以下の要素を有することを特徴とする時系列データ次元圧縮装置

( 4 ) 指定された数の上位の特異値分解の成分を、上記各セグメント幅に分解した部分時系列の代表値として、次元圧縮時系列データを生成する次元圧縮時系列デー夕生成部。

2 . 時系列データ次元圧縮装置は、上記代表値を組み合わせることで上記指定の長さの時系列データの次元を圧縮することを特徴とする請求項 1記載の時系列データ次元圧縮装置。

3 . 前記時系列デ一夕を解析して、当該時系列データを分割するセグメント幅および特異値分解について、どの成分までを利用して上記部分時系列の代表値とするかを判断するデータ解析部を備えることを特徴とする請求項 1記載の時系列データ次元圧縮装置。

4 . 以下の要素を有することを特徴とする時系列データ次元圧縮装置

( 1 ) 時間軸に沿って一定間隔で測定された一連のデ一夕である時系列元データに対して、時間軸上で所定間隔ずつ開始位置をずらして、指定の長さの時系列データを複数作成する時系列データ作成部 (2) 複数の上記時系列データのそれぞれについて、前記指定の長さの複数の時系列データに対して、平均をとる為のセグメント幅を決める中間次元決定部

(3) 前記各時系列に対して、上記平均をとる為のセグメント幅ごとに平均値を計算する平均値計算実行部

(4) 計算した上記平均値をセグメント代表値とした中間時系列を作成する中間時系列作成部

(5) それぞれの中間時系列を対象として特異値分解を行う特異値分解実行部

(6) 指定された数の上位の特異値分解の成分を上記中間時系列の圧縮データとする次元圧縮時系列データ生成部。