[go: up one dir, main page]

JP6111543B2 - Method and apparatus for extracting similar sub time series - Google Patents

Method and apparatus for extracting similar sub time series Download PDF

Info

Publication number
JP6111543B2
JP6111543B2 JP2012156266A JP2012156266A JP6111543B2 JP 6111543 B2 JP6111543 B2 JP 6111543B2 JP 2012156266 A JP2012156266 A JP 2012156266A JP 2012156266 A JP2012156266 A JP 2012156266A JP 6111543 B2 JP6111543 B2 JP 6111543B2
Authority
JP
Japan
Prior art keywords
series
time series
sub
representing
sub time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012156266A
Other languages
Japanese (ja)
Other versions
JP2013025805A (en
Inventor
ヤン・ユィハン
モン・ヤオ
シア・インジュ
ルゥ・インリアン
ユィ・ハオ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Publication of JP2013025805A publication Critical patent/JP2013025805A/en
Application granted granted Critical
Publication of JP6111543B2 publication Critical patent/JP6111543B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、時系列処理の分野に関し、具体的には、時系列から基準系列と類似するサブ時系列を抽出するための方法及び装置に関する。   The present invention relates to the field of time series processing, and in particular, to a method and apparatus for extracting a sub time series similar to a reference series from a time series.

類似なサブ時系列の抽出とは、与えられた基準と類似するサブ系列を抽出することを意味している。類似なサブ時系列の抽出は、時系列の予測、クラスタリング、異常検出などのジョブに応用される基礎技術である。例えば、時系列の予測には、トレーニングに用いられるように類似なサブ系列を抽出する必要がある。   Extracting a similar sub time series means extracting a sub series similar to a given reference. Similar sub-time series extraction is a basic technology applied to jobs such as time-series prediction, clustering, and abnormality detection. For example, for prediction of time series, it is necessary to extract similar sub-sequences so as to be used for training.

一般的には、類似なサブ系列の抽出は二つのステップに関わる。1番目のステップは、時系列の分割、即ち、時系列を複数の部分に分割するものである。2番目のステップは、類似性算出に基づいて類似するサブ系列を抽出するものである。従来の類似サブ系列の抽出技術には、主に以下の三つの問題が存在する。(1)融通のきかない分割なので、候補集合が小さくなること。(2)記憶空間及び処理時間を消費すること。(3)物理的意義を余り考慮しないこと。   In general, extracting similar subsequences involves two steps. The first step is to divide the time series, that is, divide the time series into a plurality of parts. The second step is to extract similar subsequences based on similarity calculation. The conventional similar sub-sequence extraction technique mainly has the following three problems. (1) Since the division is not flexible, the candidate set becomes small. (2) To consume storage space and processing time. (3) Do not consider physical significance.

従って、上記問題を解決できる技術の提案が希望されている。   Therefore, a proposal of a technique that can solve the above problem is desired.

以下、本発明の幾つかの面に関する基本的な理解を提供するように、本発明についての簡単な概述を提供する。この概述は本発明に対する網羅的な記述ではないことを理解すべきである。本発明の鍵または要部を特定することを意図しておらず、本発明の範囲を限定することも意図していない。その目的は単に簡略化した形式で、ある概念を提供することだけであり、これをその後の論述のより詳しい記述の序文とする。   The following presents a brief summary of the invention in order to provide a basic understanding of some aspects of the invention. It should be understood that this summary is not an exhaustive description of the invention. It is not intended to identify keys or key parts of the invention, nor is it intended to limit the scope of the invention. Its purpose is simply to provide a concept in a simplified form, which is a preface to a more detailed description of subsequent discussions.

本発明の一つの目的は、時系列から基準系列と類似するサブ時系列を抽出するための方法及び装置を提供することにある。   An object of the present invention is to provide a method and apparatus for extracting a sub time series similar to a reference series from a time series.

本発明の一つの側面によれば、時系列から基準系列と類似するサブ時系列を抽出するための方法が提供される。本方法は、時系列及び基準系列それぞれの変化傾向に基づいて、時系列及び基準系列を変換するステップと、変換された時系列を複数のサブ時系列に分割するステップと、前記複数のサブ時系列のうちの各サブ時系列に対して、各サブ時系列と変換された基準系列との編集距離を算出するステップと、算出された編集距離に基づいて、前記複数のサブ時系列から基準系列と類似するサブ時系列を抽出するステップと、を含む。   According to one aspect of the present invention, a method is provided for extracting a sub time series similar to a reference series from a time series. The method includes a step of converting the time series and the reference series based on a change tendency of each of the time series and the reference series, a step of dividing the converted time series into a plurality of sub time series, and the plurality of sub times. Calculating an edit distance between each sub time series and the converted reference series for each sub time series of the series, and based on the calculated edit distance, the reference series from the plurality of sub time series Extracting a sub time series similar to.

本発明の他の側面によれば、時系列から基準系列と類似するサブ時系列を抽出するための装置が提供される。本装置は、時系列及び基準系列それぞれの変化傾向に基づいて、時系列及び基準系列を変換する系列変換手段と、変換された時系列を複数のサブ時系列に分割するサブ時系列分割手段と、複数の時系列のうちの各時系列に対して、各時系列と変換された基準系列との編集距離を算出する編集距離算出手段と、算出された編集距離に基づいて、前記複数のサブ時系列から基準系列と類似するサブ時系列を抽出する類似時系列抽出手段と、を含む。   According to another aspect of the present invention, an apparatus for extracting a sub time series similar to a reference series from a time series is provided. The apparatus includes: a sequence conversion unit that converts a time series and a reference sequence based on a change tendency of each of the time series and the reference sequence; and a sub time series dividing unit that divides the converted time series into a plurality of sub time series. An edit distance calculating means for calculating an edit distance between each time series and the converted reference series for each time series of the plurality of time series, and the plurality of sub-sequences based on the calculated edit distance Similar time series extracting means for extracting a sub time series similar to the reference series from the time series.

また、本発明の実施例は、上記方法を実現するためのコンピュータプログラムを提供した。   The embodiment of the present invention provides a computer program for realizing the above method.

また、本発明の実施例は少なくともコンピュータによる読み取り可能な媒体の形式のコンピュータプログラム製品をさらに提供した。該コンピュータプログラム製品に上記方法を実現するためのコンピュータプログラムコードが記憶されている。   Also, embodiments of the present invention further provide a computer program product in the form of at least a computer readable medium. Computer program code for realizing the above method is stored in the computer program product.

図面との関連で以下に述べる本発明を実施するための最良の形態によって、本発明のこれらの及びその他のメリットがより明らかになる。   These and other advantages of the present invention will become more apparent from the best mode for carrying out the invention described below in connection with the drawings.

図面との関連で以下に与える本発明の実施例に対する記述を参照すれば、本発明の上記及び他の目的、特徴及びメリットをより容易に理解できるであろう。図面における各部はただ本発明の原理を示すためのものである。図面において、同一又は類似な技術的特徴又は部分は、同一又は類似の符号で示す。
本発明の実施例による、時系列から基準系列と類似するサブ時系列を抽出する方法を示すフローチャートである。 一週間の間の負荷時系列を示すグラフである。 二つの負荷サブ時系列及び一つの基準系列を示すグラフである。 本発明の実施例による、時系列から基準系列と類似するサブ系列を抽出するための装置のブロック図である。 本発明の時系列から基準系列と類似するサブ時系列を抽出する方法及び装置を実施するためのコンピューティング装置の例示的な構造を示す図である。
The above and other objects, features and advantages of the present invention will be more readily understood with reference to the following description of embodiments of the invention given in connection with the drawings. Each part in the drawings is only for illustrating the principle of the present invention. In the drawings, the same or similar technical features or parts are denoted by the same or similar reference numerals.
4 is a flowchart illustrating a method for extracting a sub time series similar to a reference series from a time series according to an embodiment of the present invention. It is a graph which shows the load time series for one week. It is a graph which shows two load sub time series and one reference series. FIG. 3 is a block diagram of an apparatus for extracting a sub-sequence similar to a reference sequence from a time series according to an embodiment of the present invention. FIG. 2 is a diagram illustrating an exemplary structure of a computing device for implementing the method and apparatus for extracting a sub time series similar to a reference series from the time series of the present invention.

以下、図面を参照しながら本発明の実施例を説明する。本発明の一図面または一実施例に記載の要素及び特徴は、一つまたは複数の他の図面または実施例に示される要素及び特徴と結合することができる。明確のため、図面及び明細書では、本発明と直接関係しない、当業者にとって既知の部品及び処理の表示及び記載は省略した。   Embodiments of the present invention will be described below with reference to the drawings. Elements and features described in one drawing or embodiment of the invention may be combined with elements and features shown in one or more other drawings or embodiments. For clarity, illustration and description of parts and processes known to those skilled in the art that are not directly related to the present invention are omitted in the drawings and specification.

図1を参照しながら、本発明の実施例による、時系列から基準系列と類似するサブ時系列を抽出するための方法100を説明する。   Referring to FIG. 1, a method 100 for extracting a sub time series similar to a reference series from a time series according to an embodiment of the present invention will be described.

図1に示すように、ステップS102において、時系列及び基準系列それぞれの変化傾向に基づいて時系列及び基準系列を変換することができる。   As shown in FIG. 1, in step S102, the time series and the reference series can be converted based on the changing tendency of each of the time series and the reference series.

具体的には、時系列における現在要素の一つ前の要素または複数前の要素に対する変化に基づいて時系列を変換することができる。また、基準系列における現在要素の一つ前の要素または複数前の要素に対する変化に基づいて基準系列を変換することができる。   Specifically, the time series can be converted based on a change with respect to the previous element or a plurality of previous elements of the current element in the time series. In addition, the reference sequence can be converted based on the change in the reference element from the previous element or a plurality of previous elements of the current element.

代わりに、時系列における現在要素の一つ後の要素又は複数後の要素に対する変化に基づいて時系列を変換することができる。また、基準系列における現在要素の一つ後の要素または複数後の要素に対する変化に基づいて基準系列を変換することができる。   Instead, the time series can be converted based on changes to the next element or elements after the current element in the time series. Further, the reference sequence can be converted on the basis of the change of the current element in the reference sequence with respect to the next element or a plurality of subsequent elements.

ここで、時系列及び基準系列の変換に対して同じ変換規則を採用する。なお、時系列と基準系列の変換は以上の方式に限定されず、当業者が想到できるいずれの他の方式で時系列及び基準系列を変換してもよく、このような変換は系列の変化傾向を反映することができればよい。   Here, the same conversion rule is adopted for the conversion of the time series and the reference series. Note that the conversion between the time series and the reference sequence is not limited to the above method, and the time series and the reference sequence may be converted by any other method that can be conceived by those skilled in the art. If it can reflect.

次に、ステップS104において、変換後の時系列を複数のサブ時系列に分割することができる。   Next, in step S104, the converted time series can be divided into a plurality of sub time series.

好ましくは、基準系列の長さと異なっていてもよい所定の分割ステップ長さに従って、変換された時系列を複数のサブ時系列に分割することができる。また、基準系列の長さと異なっていてもよい所定の分割する長さに従って、変換された時系列を複数のサブ時系列に分割することができる。時系列に対してこのような柔軟な分割を行うことによって、時系列をより能動的に分割することができ、必要に応じて相応の分割結果が得られ、必要する類似なサブ系列が取得される。例えば、基準系列と類似するが、長さが基準系列と異なる類似サブ系列を取得することができる。   Preferably, the converted time series can be divided into a plurality of sub time series according to a predetermined division step length which may be different from the length of the reference series. Further, the converted time series can be divided into a plurality of sub time series according to a predetermined division length that may be different from the length of the reference series. By performing such flexible division on the time series, the time series can be divided more actively, and corresponding division results can be obtained as necessary, and necessary similar sub-sequences can be obtained. The For example, a similar sub-sequence similar to the reference sequence but having a length different from that of the reference sequence can be acquired.

次に、ステップS106において、分割された複数のサブ時系列のうちの各サブ時系列に対して、各サブ時系列と変換された基準系列との編集距離を算出することができる。   Next, in step S106, the edit distance between each sub time series and the converted reference series can be calculated for each sub time series among the plurality of divided sub time series.

好ましくは、上記算出において、各サブ時系列と変換された基準系列との重み付け編集距離を算出する。尚、以下の要求うちの一つまたは複数を満足することができる。即ち、挿入操作について、異なる要素の挿入に対して異なる重みの付与が許可されること、削除操作について、異なる要素の削除に対して異なる重みの付与が許可されること、及び、置換操作について、異なる要素ペアの置換に対して、異なる重みの付与が許可されることを含む。重みを利用しない伝統的な方法と比べると、各サブ時系列と変化後の基準系列との重み付け編集距離を算出することによって、基準系列とより類似するサブ時系列が基準系列までのより短い編集距離を有し得るようになる。   Preferably, in the above calculation, a weighted edit distance between each sub time series and the converted reference series is calculated. One or more of the following requirements can be satisfied. That is, regarding the insertion operation, it is allowed to give different weights for insertion of different elements, for the deletion operation, it is allowed to give different weights to deletion of different elements, and for the replacement operation, This includes allowing different weights to be assigned to different element pair replacements. Compared to the traditional method that does not use weights, the sub time series more similar to the reference series is shorter to the reference series by calculating the weighted edit distance between each sub time series and the changed reference series. Can have a distance.

ステップS108において、算出された編集距離に基づいて複数のサブ時系列から基準系列と類似するサブ時系列を抽出する。   In step S108, a sub time series similar to the reference series is extracted from a plurality of sub time series based on the calculated editing distance.

具体的には、複数のサブ時系列から所定の閾値より小さい編集距離を有する一つまたは複数のサブ時系列を基準系列と類似するサブ時系列として抽出する。   Specifically, one or a plurality of sub time series having an edit distance smaller than a predetermined threshold is extracted as a sub time series similar to the reference series from the plurality of sub time series.

好ましくは、複数のサブ時系列から最小編集距離を有するサブ時系列を所定の数だけ基準系列と類似するサブ時系列として抽出する〔つまり、編集距離が小さい順に所定の数だけ抽出する〕。   Preferably, a predetermined number of sub time series having a minimum editing distance is extracted as a sub time series similar to the reference series from a plurality of sub time series (that is, a predetermined number is extracted in ascending order of editing distance).

もちろん、基準系列と類似するサブ時系列を抽出するのは、上記の方式で行うことに限定されず、当業者が想到できるいずれの方式で実行してもよい。   Of course, extracting the sub time series similar to the reference series is not limited to the above method, and may be performed by any method conceivable by those skilled in the art.

以下、図2及び3を参照し、負荷時系列から基準系列と類似するサブ時系列を抽出する方法を説明する。なお、図2は一週間の負荷時間系列を示すグラフであり、図3は、二つの負荷サブ時系列及び一つの基準系列を示すグラフである。しかし、負荷と関連する時系列はただ一つの例に過ぎないことを理解すべきである。実際は、本発明により処理される時系列はいかなる時系列であってもよく、図2及び図3の形式に限定されない。   Hereinafter, a method for extracting a sub time series similar to the reference series from the load time series will be described with reference to FIGS. 2 is a graph showing a one-week load time series, and FIG. 3 is a graph showing two load sub-time series and one reference series. However, it should be understood that the time series associated with the load is only one example. Actually, the time series processed by the present invention may be any time series, and is not limited to the formats shown in FIGS.

まず、時系列と基準系列それぞれの変化傾向に基づいて、時系列と基準系列を変換する、即ち、現在要素と、その一つ前の要素または複数前の要素との変化を比較することによって多種の変換を行う。例えば、時系列はc1,c2,c3,……,cnであり、nは1より大きい整数である。基準系列はb1,b2,……,bmであり、mは1より大きい整数である。通常、mはnより小さい。もちろん、nより大きい場合も排除されない。 First, the time series and the reference series are converted based on the change tendency of each of the time series and the reference series, that is, various changes are made by comparing changes between the current element and the previous element or a plurality of previous elements. Perform the conversion. For example, the time series is c 1 , c 2 , c 3 ,..., C n , and n is an integer greater than 1. The reference sequence is b 1 , b 2 ,..., B m , where m is an integer greater than 1. Usually, m is smaller than n. Of course, it is not excluded even if it is larger than n.

例えば、以下の(1)式により時系列を変換する一方、以下の(2)式により基準系列を変換してもよい。

Figure 0006111543
ただし、必要に応じて予めeを設定しておく、またはパラメータ・トレーニングによってeを取得してもよい。 For example, the time series may be converted by the following expression (1), while the reference series may be converted by the following expression (2).
Figure 0006111543
However, e may be set in advance as necessary, or e may be acquired by parameter training.

または、以下の(3)式により時系列を変換する一方、以下の(4)式により基準系列を変換することができる。

Figure 0006111543
ただし、必要に応じて予めgを設定しておく、またはパラメータ・トレーニングによってgを取得してもよい。 Alternatively, the time series can be converted by the following expression (3), while the reference series can be converted by the following expression (4).
Figure 0006111543
However, g may be set in advance as necessary, or g may be acquired by parameter training.

(1)式及び(2)式または(3)式及び(4)式は、例示的な変換方式に過ぎず、実際は、必要に応じて当業者が想到できる他のいかなる変換方式を採用してもよく、当該方式は時系列と基準系列との変化傾向を反映できるものであればよい。   Equations (1) and (2) or (3) and (4) are merely exemplary conversion methods, and in practice, any other conversion method that can be conceived by those skilled in the art is adopted as necessary. The method may be any method that can reflect the change tendency between the time series and the reference series.

次に、式(1)を例として図2に示された負荷時系列の変換を説明する。式(1)により、図2におけるグラフを次の形に変換することができる。   Next, the conversion of the load time series shown in FIG. 2 will be described using Equation (1) as an example. With the expression (1), the graph in FIG. 2 can be converted into the following form.

20022222212000012222100001222222200000002221000000222222000000012222100000222222000000002222000000022222200000002220000000002222200000002220000000222222000000000220000。   20022222212000012222100001222222200000002221000000222222000000012222100000222222000000002222000000022222200000002220000000002222200000002220000000222222000000000220000.

そして、(2)式により基準系列(図示せず)を変換する。   Then, a reference sequence (not shown) is converted by equation (2).

次に、上記の時系列に対して分割を行うことができる。   Next, the above time series can be divided.

好ましくは、柔軟な分割方式、即ち、基準系列の長さと異なっていてもよい所定のステップの長さ及び所定の長さに従って、変換された時系列を複数のサブ時系列に分割する。   Preferably, the converted time series is divided into a plurality of sub time series according to a flexible division method, that is, according to a predetermined step length and a predetermined length which may be different from the length of the reference sequence.

仮に変換された基準系列の長さは8とする。基準系列の長さと同じ所定のステップの長さ及び所定の長さに従って時系列を分割する場合、即ち、分割処理に使用される所定のステップ長さ及び所定の長さのいずれも8である場合に、上記時系列は、例えば、以下のように分割される。
20022222,21200001,22221000,01222222……
同様に、仮に変換後の基準系列の長さは8とする。基準系列の長さと異なる所定のステップ長さに従い、かつ、基準系列の長さと同一の所定の長さに従って時系列を分割する場合、例えば、分割処理に使用される所定のステップ長さは6であり、所定の長さは8である場合、上記時系列は以下のように分割することができる。〔つまり、分割された(互いに重複する)各サブ系列の長さは8であり、各サブ系列の先頭の間のステップ(間隔)の長さは6である。〕
20022222,22212000,00012222,22100001……
引き続き変換後の基準系列の長さは8とする。基準系列の長さと同一の所定のステップ長さに従い、かつ、基準系列の長さと異なる所定の長さに従って時系列を分割する場合、例えば、分割処理に使用される所定のステップ長さは8であり、所定の長さは6である場合に、上記時系列は以下のように分割することができる。〔つまり、分割された各サブ系列の長さは6であり、各サブ系列の先頭の間のステップ(間隔)の長さは8であり、各サブ系列の末尾と次のサブ系列の先頭との間に長さ2のギャップがある。〕
200222,212000,222210,012222……
引き続き変換後の基準系列の長さは8とする。基準系列の長さと異なる所定のステップ長さに従い、かつ、基準系列の長さと異なる所定の長さに従って時系列を分割する場合、例えば、分割処理に使用される所定のステップ長さは6であり、所定の長さは6である場合、上記時系列は以下のように分割することができる。
200222,222120,000122,221000……
ここでの6及び8といった長さおよびステップ長さは例示的なものであり、本発明を限定するものではないことを理解しておくべきである。
The length of the converted reference sequence is assumed to be 8. When dividing a time series according to a predetermined step length and a predetermined length that are the same as the length of the reference sequence, that is, when both the predetermined step length and the predetermined length used for the dividing process are 8 The time series is divided as follows, for example.
20022222,21200001,22221000,01222222 ……
Similarly, the length of the reference sequence after conversion is assumed to be 8. When dividing a time series according to a predetermined step length different from the length of the reference sequence and according to a predetermined length equal to the length of the reference sequence, for example, the predetermined step length used for the division process is 6 If the predetermined length is 8, the time series can be divided as follows. [That is, the length of each divided sub-sequence (overlapping each other) is 8, and the length of the step (interval) between the heads of each sub-sequence is 6. ]
20022222,22212000,00012222,22100001 ……
The length of the reference sequence after conversion is assumed to be 8. When dividing a time series according to a predetermined step length that is the same as the length of the reference sequence and according to a predetermined length that is different from the length of the reference sequence, for example, the predetermined step length used for the dividing process is 8. If the predetermined length is 6, the time series can be divided as follows. [That is, the length of each divided sub-sequence is 6, the length of the step (interval) between the heads of each sub-sequence is 8, and the end of each sub-sequence and the beginning of the next sub-sequence There is a gap of length 2 between them. ]
200222,212000,222210,012222 ……
The length of the reference sequence after conversion is assumed to be 8. When dividing a time series according to a predetermined step length different from the length of the reference sequence and according to a predetermined length different from the length of the reference sequence, for example, the predetermined step length used for the dividing process is 6 If the predetermined length is 6, the time series can be divided as follows.
200222,222120,000122,221000 ……
It should be understood that the lengths and step lengths here, such as 6 and 8, are exemplary and not limiting of the invention.

複数のサブ時系列のうち各時系列と変換された基準系列との重み付け編集距離を算出する。例えば、変換されたサブ時系列X{c1,c2,…,ci}と基準系列Y{b1,b2,…,bj}との編集距離D(i,j)は、以下の式で算出することができる。

Figure 0006111543
A weighted edit distance between each time series and the converted reference series among the plurality of sub time series is calculated. For example, transformed sub time series X {c 1, c 2, ..., c i} a reference sequence Y {b 1, b 2, ..., b j} edit distance between D (i, j) is the following It can be calculated by the following formula.
Figure 0006111543

二つの系列の間の編集距離とは、幾つかの操作により一方の系列を他方の系列に変換するのに必要な最小コストを意味する。なお、wiは挿入操作のコストであり、wdは削除操作のコストであり、wrは置換操作のコストである。実際には、上述したように、挿入操作について、異なる要素の挿入に対して異なる重みの付与を許可し、削除操作について、異なる要素の削除に対して異なる重みの付与を許可し、置換操作について、異なる要素ペアに対して異なる重みの付与を許可することができる。 The edit distance between two sequences means the minimum cost required to convert one sequence to the other by several operations. Note that w i is the cost of the insert operation, w d is the cost of the delete operation, and wr is the cost of the replacement operation. Actually, as described above, regarding insertion operations, different weights are allowed for insertion of different elements, and for deletion operations, different weights are permitted for deletion of different elements. Different weights can be given to different element pairs.

以下では、挿入操作について、異なる要素の挿入に同一重みを付与し、削除操作について、異なる要素の削除に対して同一重みを付与し、及び置換操作について、異なる要素ペアの置換に対して異なる重みを付与する。(6)-(8)(式)により、wi,wd及びwrを特定してもよい。

Figure 0006111543
ただし、xi及びyiは距離を算出すべき二つの系列中の対応する要素である。 In the following, for the insertion operation, the same weight is given to the insertion of different elements, for the deletion operation, the same weight is given to the deletion of different elements, and for the replacement operation, different weights are given to the replacement of different element pairs. Is granted. (6)-(8) (Formula) may specify w i , w d, and w r .
Figure 0006111543
Where x i and y i are the corresponding elements in the two sequences whose distances are to be calculated.

(5)-(8)式により編集距離を算出した後に、重み付け編集最小距離の所定の閾値よりも小さいサブ時系列、又は距離の最も小さい一定数のサブ系列を、類似なサブ時系列として抽出する。   After calculating the edit distance using equations (5)-(8), a sub time series smaller than a predetermined threshold of the minimum weighted edit distance or a certain number of sub series with the smallest distance are extracted as similar sub time series. To do.

図3は、二つの負荷サブ時系列及び一つの基準系列を示すグラフである。図3に示すように、A及びBはそれぞれサブ時系列を示し、Cは基準系列を示す。図2の時系列に対応するサブ時系列を与えるわけではなく、(5)-(8)式を説明するために、任意にサブ系列A及びサブ時系列Bを与えている。図2の時系列に分割を行ってサブ時系列を取得し、そして、取得したサブ時系列と基準系列Cとの編集距離を算出してもよいことを理解すべきである。
(1)式により、サブ時系列Aを以下のように変換することができる。00112222111000122221000。
(1)式により、サブ時系列Bを以下のように変換することができる。00112222222000122221000。
(2)式により、サブ時系列Cを以下のように変換することができる。00112222000200122221000。
FIG. 3 is a graph showing two load sub time series and one reference series. As shown in FIG. 3, A and B each indicate a sub time series, and C indicates a reference series. The sub time series corresponding to the time series of FIG. 2 is not given, but the sub series A and the sub time series B are arbitrarily given in order to explain the equations (5) to (8). It should be understood that the time series of FIG. 2 may be divided to obtain the sub time series, and the edit distance between the obtained sub time series and the reference series C may be calculated.
From the equation (1), the sub time series A can be converted as follows. 00112222 1110 00122221000.
From the equation (1), the sub time series B can be converted as follows. 00112222 2220 00122221000.
From the equation (2), the sub time series C can be converted as follows. 00112222 0002 00122221000.

伝統的な編集距離の算出方法、即ち、重みが導入されていない場合、サブ時系列Aと基準時系列Cの間の編集距離D(A,C)=4となり、サブ時系列Bと基準時系列Cの間の編集距離D(B,C)=4となる。   When the traditional edit distance calculation method, that is, when no weight is introduced, the edit distance D (A, C) between the sub time series A and the reference time series C = 4, and the sub time series B and the reference time The edit distance D (B, C) between the series C is 4.

(5)-(8)式により算出される重み付け編集距離は以下の通りであり、サブ時系列Aと基準時系列Cの間の編集距離D’(A,C)=2.5となり、サブ時系列Bと基準時系列Cの間の編集距離D’(B,C)=4となる。   The weighted edit distance calculated by the equations (5) to (8) is as follows, and the edit distance D ′ (A, C) between the sub time series A and the reference time series C is 2.5, and the sub time series The edit distance D ′ (B, C) = 4 between B and the reference time series C.

図3から、時系列A、時系列B及び基準系列Cの大部分が重なっており、これらの中間部分のみが異なることが分かる。サブ時系列Bの中間部分が上に位置し、サブ時系列Aの中間部分が中間に位置し、基準系列Cの中間部分が下に位置するため、サブ時系列Aのほうが基準Cにより近い。重み付け編集距離の算出方法で算出された結果は、図3の実際の状況により合っており、サブ時系列Aと基準系列Cとの編集距離D’(A,C)=2.5、サブ時系列Bと基準時系列Cの間の編集距離D’(B,C)=4から、D’(A,C)<D’(B,C)となる。これに比べて、重み付けが導入されていない伝統的な編集方法においては、サブ時系列Aと基準系列Cとの編集距離D(A,C)=4、サブ時系列Bと基準時系列Cの間の編集距離D(B,C)=4から、D(A,C)=D(B,C)となるが、このような結果は図3の実際の状況を反映することができない。   From FIG. 3, it can be seen that most of time series A, time series B, and reference series C overlap, and only the middle part thereof is different. Since the middle part of the sub time series B is located above, the middle part of the sub time series A is located in the middle, and the middle part of the reference series C is located below, the sub time series A is closer to the reference C. The result calculated by the weighted edit distance calculation method is more suitable for the actual situation of FIG. 3, and the edit distance D ′ (A, C) = 2.5 between the sub time series A and the reference series C, sub time series B Since the edit distance D ′ (B, C) = 4 between the reference time series C and D ′ (A, C) <D ′ (B, C). On the other hand, in the traditional editing method in which no weighting is introduced, the editing distance D (A, C) between the sub time series A and the reference time series C = 4, the sub time series B and the reference time series C Since the edit distance D (B, C) = 4 in the interval, D (A, C) = D (B, C), but such a result cannot reflect the actual situation of FIG.

以下、図4を参照しながら本発明の実施例である、時系列から基準系列と類似するサブ時系列を抽出する装置400を説明する。なお、上記方法と対応する部分と重複しない、装置400の基本的な枠組のみを説明する。   Hereinafter, an apparatus 400 for extracting a sub time series similar to a reference series from a time series, which is an embodiment of the present invention, will be described with reference to FIG. Only the basic framework of the apparatus 400 that does not overlap with the parts corresponding to the above method will be described.

図4に示すように、装置400は、系列変換手段402と、サブ時系列分割手段404と、編集距離算出手段406と、類似サブ時系列抽出手段408とを含むことができる。   As shown in FIG. 4, the apparatus 400 can include a series conversion unit 402, a sub time series division unit 404, an edit distance calculation unit 406, and a similar sub time series extraction unit 408.

なお、系列変換手段402は、時系列及び基準系列それぞれの変化傾向により、時系列及び基準系列を変換するように構成されてもよい。   Note that the series conversion unit 402 may be configured to convert the time series and the reference series according to the changing tendency of each of the time series and the reference series.

系列変換手段402は、時系列変換サブ手段と、基準系列変換サブ手段と(いずれも図示せず)を含んでもよい。時系列変換サブ手段は、時系列における現在要素の一つ前の要素または複数前の要素に対する変化に基づいて時系列を変換する。基準系列変換手段は、基準系列における現在要素の一つ前の要素または複数前の要素に対する変化に基づいて基準系列を変換することができる。   Series conversion unit 402 may include a time series conversion sub unit and a reference sequence conversion sub unit (none of which are shown). The time series conversion sub means converts the time series based on a change in the previous element or a plurality of previous elements of the current element in the time series. The reference sequence conversion means can convert the reference sequence based on a change of the current element in the reference sequence with respect to the previous element or a plurality of previous elements.

好ましくは、時系列変換サブ手段は、時系列における現在要素の一つ後の要素または複数後の要素に対する変化に基づいて、時系列を変換することができる。基準系列変換サブ手段は、基準系列における現在要素の一つ後の要素または複数後の要素に対する変化に基づいて、基準系列を変換することができる。   Preferably, the time series conversion sub means can convert the time series based on a change of the current element in the time series with respect to the next element or a plurality of subsequent elements. The reference sequence conversion sub means can convert the reference sequence based on a change of the current element in the reference sequence with respect to the next element or a plurality of subsequent elements.

サブ時系列分割手段404は、変換された時系列を複数のサブ時系列に分割するように構成されてもよい。   The sub time series dividing unit 404 may be configured to divide the converted time series into a plurality of sub time series.

サブ時系列分割手段404は、さらに、基準系列の長さと異なっていてもよい所定の分割ステップの長さ及び/又は基準系列の長さと異なっていてもよい所定の分割長さに従って、変換された時系列を複数のサブ時系列に分割するように構成されてもよい。   The sub time series dividing means 404 is further transformed according to a predetermined division step length that may be different from the reference sequence length and / or a predetermined division length that may be different from the reference sequence length. The time series may be divided into a plurality of sub time series.

編集距離算出手段406は、複数のサブ時系列のうちの各時系列に対して、各時系列と変換された後の基準系列との編集距離を算出するように構成されてもよい。   The edit distance calculation means 406 may be configured to calculate an edit distance between each time series and the converted reference series for each time series of the plurality of sub time series.

なお、編集距離算出手段406は各時系列と変換された基準系列との間の重み付け編集距離を算出することができる。なお、以下の要求のうちの一つ又は複数を満たしている。挿入操作について、異なる要素の挿入に対して異なる重みの付与を許可すること、削除操作について、異なる要素の削除について異なる重みの付与を許可すること、置換操作について、異なる要素ペアの置換に対して異なる重みの付与を許可すること。   The edit distance calculation means 406 can calculate a weighted edit distance between each time series and the converted reference series. Note that one or more of the following requirements are satisfied. For insertion operations, allow different weights for insertion of different elements, for deletion operations, allow different weights for deletion of different elements, for replacement operations, for replacement of different element pairs Allow the application of different weights.

類似サブ時系列抽出手段408は、算出された編集距離に基づいて、複数の時系列から、基準系列と類似するサブ時系列を抽出するように構成されてもよい。   The similar sub time series extracting unit 408 may be configured to extract a sub time series similar to the reference series from a plurality of time series based on the calculated editing distance.

類似サブ時系列抽出手段408は、複数のサブ時系列から、所定の閾値より小さい編集距離を有する一つ又は複数のサブ時系列を、基準系列と類似するサブ時系列抽出するように構成されてもよい。   The similar sub time series extracting means 408 is configured to extract one or a plurality of sub time series having an edit distance smaller than a predetermined threshold from a plurality of sub time series, and sub time series similar to the reference series. Also good.

代わりに、類似サブ時系列抽出手段408は、さらに、複数のサブ時系列から一定数の、最小編集距離を有するサブ時系列を、基準系列と類似するサブ時系列抽出するように構成されてもよい。〔つまり、編集距離が小さいほうから一定数を抽出する。〕
本発明の実施例によれば、より迅速に類似なサブ時系列を抽出することができ、時系列の柔軟な分割を実現するとともに、実用に応じて系列の物理的な意義により、類似な時系列を抽出することができる。
Alternatively, the similar sub time series extraction unit 408 may be further configured to extract a sub time series having a minimum number of minimum edit distances from a plurality of sub time series, and sub time series similar to the reference series. Good. [That is, a certain number is extracted from the one with the smaller edit distance. ]
According to the embodiment of the present invention, similar sub time series can be extracted more quickly, flexible time division can be realized, and similar time can be obtained depending on the physical significance of the series according to practical use. A series can be extracted.

上記の具体的な実施例との関連で本発明の基本原理を説明したが、当業者にとって、本発明の方法及び装置のすべてまたは任意のステップまたは部品は、任意のコンピューティング装置(プロセッサや記憶媒体などを含む)またはコンピューティング装置のネットワークにおいて、ハードウェア、ファームウェア及びソフトウェアまたはこれらの組み合わせにより実現されることを理解すべきである。これは、本発明の明細書を読んだ当業者の基本なプログラミング技能で実現可能なものである。   Although the basic principles of the present invention have been described in connection with the specific embodiments described above, for those skilled in the art, all or any step or component of the method and apparatus of the present invention may be performed on any computing device (processor or memory). It should be understood that the present invention may be implemented by hardware, firmware and software, or a combination thereof, in a network of computing devices). This can be achieved with the basic programming skills of those skilled in the art who have read the specification of the present invention.

したがって、本発明の目的は、任意のコンピューティング装置において一つのプログラムまたは一組のプログラムを実行することによって実現されてもよい。上記コンピューティング装置は公知の汎用装置であってもよい。したがって、本発明の目的は、さらに、前記方法または装置を実現するためのプログラムコードを含むプログラム製品を提供することによって実現されてもよい。つまり、このようなプログラム製品も本発明を構成することができ、かつこのようなプログラムを記憶する製品も本発明を構成することがきることが分かる。明らかなように、前記記憶媒体は任意の公知の記憶媒体または将来に開発される任意のものであってもよい。   Accordingly, the objects of the present invention may be realized by executing a program or a set of programs on any computing device. The computing device may be a known general purpose device. Therefore, the object of the present invention may be further realized by providing a program product including a program code for realizing the method or apparatus. That is, it can be understood that such a program product can also constitute the present invention, and a product storing such a program can constitute the present invention. As will be apparent, the storage medium may be any known storage medium or any one developed in the future.

本発明の実施例は、ソフトウェア及び/又はファームウェアにより実現される場合に、記憶媒体又はネットワークから、専用ハードウェア構造を有するコンピュータ(例えば、図5に示される汎用コンピュータ500)へ当該ソフトウェアを構成するプログラムをインストールする。当該コンピュータは、各種のプログラムがインストールされた時に、各種機能の実行等が可能である。   Embodiments of the present invention, when implemented by software and / or firmware, configure the software from a storage medium or network to a computer having a dedicated hardware structure (eg, general purpose computer 500 shown in FIG. 5). Install the program. The computer can execute various functions when various programs are installed.

図5において、中央処理手段(CPU)501は、読取専用メモリ(ROM)502に記憶されたプログラム、又は記憶部508からランダムアクセスメモリ(RAM)503にロードされたプログラムに基づいて、各種の処理を実行する。RAM503において、必要に応じ、CPU501が各種の処理等を実行するときに必要されるデータも記憶される。CPU501、ROM502及びRAM503は、バス504を経由して互いに接続される。入力/出力インターフェース505もバス504に接続される。   In FIG. 5, a central processing unit (CPU) 501 performs various processes based on a program stored in a read-only memory (ROM) 502 or a program loaded from a storage unit 508 to a random access memory (RAM) 503. Execute. In the RAM 503, data necessary when the CPU 501 executes various processes and the like is stored as necessary. The CPU 501, ROM 502, and RAM 503 are connected to each other via a bus 504. An input / output interface 505 is also connected to the bus 504.

以下の部品が入力/出力インターフェース505に接続される。入力部506(キーボード、マウス等を含む)と、出力部507(ブラウン管(CRT)、液晶ディスプレイ(LCD)等のようなディスプレイ及びスピーカ等を含む)と、記憶部508(ハードディスク等を含む)と、通信部509(LANカードのようなネットワークインターフェースカード、モデム等を含む)とを含む。必要に応じて、通信部509が入力/出力インターフェース505に接続されてもよい。取り外し可能な媒体511、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等が必要に応じてドライブ510に取り付けられ、これによりその中から読み出されたコンピュータプログラムが必要に応じて記憶部508にインストールされる。   The following components are connected to the input / output interface 505. An input unit 506 (including a keyboard and a mouse), an output unit 507 (including a display such as a cathode ray tube (CRT), a liquid crystal display (LCD), and a speaker), and a storage unit 508 (including a hard disk) A communication unit 509 (including a network interface card such as a LAN card, a modem, and the like). The communication unit 509 may be connected to the input / output interface 505 as necessary. A removable medium 511, for example, a magnetic disk, an optical disk, a magneto-optical disk, a semiconductor memory, or the like is attached to the drive 510 as necessary, whereby a computer program read from the medium is stored in the storage unit 508 as necessary. Installed.

ソフトウェアにより上記の一連の処理を実現する場合は、ネットワーク、例えばインターネット、または記憶媒体、例えば取り外し可能媒体511からソフトウェアを構成するプログラムをインストールする。   When the above-described series of processing is realized by software, a program constituting the software is installed from a network, for example, the Internet, or a storage medium, for example, a removable medium 511.

このような記憶媒体は、図5に示された、その中にプログラムが記憶されており、デバイスから離れて配送されてユーザにプログラムを提供する取り外し可能な媒体511に限定されないことを、当業者は理解するはずである。取り外し可能な媒体511としては、例えば、磁気ディスク(フロッピー(登録商標)ディスクを含む)、光ディスク(コンパクトディスクリードオンリーメモリ(CD−ROM)やディジタルヴァーサタイルディスク(DVD)を含む)、光磁気ディスク(ミニディスク(MD)(登録商標)を含む)及び半導体メモリを含む。または、記憶媒体は、ROM502、記憶部508に含まれるハードディスクであって、プログラムが記憶されており、かつそれらを含むデバイスと一緒にユーザに配送されるハードディスクなどであってもよい。   Those skilled in the art will recognize that such storage media is not limited to the removable media 511 shown in FIG. 5 in which the program is stored and delivered remotely from the device to provide the program to the user. Should understand. Examples of the removable medium 511 include a magnetic disk (including a floppy (registered trademark) disk), an optical disk (including a compact disk read-only memory (CD-ROM) and a digital versatile disk (DVD)), and a magneto-optical disk. (Including Mini Disc (MD) (registered trademark)) and semiconductor memory. Alternatively, the storage medium may be a hard disk included in the ROM 502 and the storage unit 508, which stores a program and is delivered to a user together with a device including them.

本発明は、さらに、機器による読み取り可能な命令コードが記憶されているプログラム製品を提供する。命令コードは、機器に読み取られて実行される際に、上記の本発明の実施例による方法を実行することができる。   The present invention further provides a program product in which an instruction code readable by a device is stored. When the instruction code is read and executed by the device, the method according to the above-described embodiment of the present invention can be executed.

相応に、上記の機器による読み取り可能な命令コードが記憶されているプログラム製品を搭載するための記憶媒体も本発明の開示に含まれる。記憶媒体はフロッピーディスク、光ディスク、光磁気ディスク、メモリカード、メモリスティックなどを含むが、これらに限定されない。   Correspondingly, a storage medium for mounting a program product in which an instruction code readable by the above device is stored is also included in the disclosure of the present invention. Storage media include, but are not limited to, floppy disks, optical disks, magneto-optical disks, memory cards, memory sticks, and the like.

当業者は、ここで与えられた例は、例示的なものであり、これらに限定されないことを理解すべきである。   Those skilled in the art should understand that the examples given here are illustrative and not limiting.

明細書において、「1番目」、「2番目」及び「N番目」の記載は、説明した特徴を区別し、本発明を明瞭に説明するためのものである。したがって、これらをいかなる限定性意味と見なすべきでもない。   In the specification, the descriptions of “first”, “second” and “Nth” are for distinguishing the described features and clearly illustrating the present invention. Therefore, these should not be regarded as any limiting meaning.

一つの例として、上記方法の各ステップ及び上記装置の各構成モジュール及び/または手段は、ソフトウェア、ファームウェア及びハードウェアまたはこれらの組み合わせとして実現されてもよく、かつ相応する装置における一部にする。上記装置における各構成モジュール、手段を、ソフトウェア、ファームウェア及びハードウェアまたはこれらの組み合わせの方式で構成するときに使用される具体的な手段または方式は、当業者に熟知されるものであるため、ここでくだくだと説明はしない。   As an example, each step of the method and each component module and / or means of the device may be implemented as software, firmware and hardware or a combination thereof and is part of a corresponding device. The specific means or method used when configuring each component module and means in the above-described apparatus in the form of software, firmware and hardware or a combination thereof is well known to those skilled in the art. Please do not explain.

一つの例示として、ソフトウェアまたはファームウェアで実現された場合に、記憶媒体またはネットワークから、専用なハードウェア構造を有するコンピュータ(例えば、図5に示す汎用コンピュータ500)へ当該ソフトウェを構成するプログラムをインストールしてもよい。当該コンピュータは、各種のプログラムがインストールされた場合に、各種の機能などを実行することができる。   As an example, when implemented by software or firmware, a program constituting the software is installed from a storage medium or a network to a computer having a dedicated hardware structure (for example, the general-purpose computer 500 shown in FIG. 5). May be. The computer can execute various functions when various programs are installed.

上記の本発明を実施するための形態に対する説明において、一実施形態で説明及び/又は図示された特徴は、相同または類似する方式で、一つまたは複数のほかの実施形態に使用されてもよく、他の実施形態における特徴と組み合わせ、又は他の実施形態中の特徴を置換してもよい。   In the above description of the mode for carrying out the invention, the features described and / or illustrated in one embodiment may be used in one or more other embodiments in a homologous or similar manner. , In combination with features in other embodiments, or features in other embodiments may be replaced.

用語「含む/有する」とは、本稿に使用されるときには、特徴、要素、ステップまたはコンポーネントの存在を意味しているが、一つまたは複数のほかの特徴、要素、ステップまたはコンポーネントの存在または付加を排除するものではない。   The term “comprising / having” as used herein means the presence of a feature, element, step or component, but the presence or addition of one or more other features, elements, steps or components. Is not to be excluded.

また、本発明の方法は明細書に説明した時間順に従って実行することに限定されない。他の時間順に従って、並行して又は互いに独立に実行してもよい。したがって、本明細書に説明した方法の実行順序は、本発明の技術範囲を限定しない。   Further, the method of the present invention is not limited to being performed according to the time order described in the specification. They may be executed in parallel or independently of each other according to other time orders. Therefore, the execution order of the methods described herein does not limit the technical scope of the present invention.

本発明の具体的な実施形態に対する説明で本発明を開示したが、当業者が特許請求の範囲の精神及び範囲内で、各種の修正、改善又は同等なものを設計することができる。これらの修正、改善又は同等なものも本発明の保護範囲内にカーバされると考えられる。   While the invention has been disclosed in terms of specific embodiments of the invention, those skilled in the art can design various modifications, improvements or equivalents within the spirit and scope of the claims. These modifications, improvements or equivalents are also considered to be covered within the protection scope of the present invention.

上記の実施例を含む実施形態について、以下の付記も含まれている。
付記:
(付記1)
時系列から基準系列と類似するサブ時系列を抽出する方法であって、コンピュータが、
前記時系列及び前記基準系列を、それぞれ前記時系列及び前記基準系列の変化傾向を表す系列に変換し、
変換された時系列を複数のサブ時系列に分割し、
前記複数のサブ時系列のうちの各サブ時系列と変換された基準系列との間の編集距離を算出し、
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出することを特徴とする方法。
(付記2)
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ前または複数前の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ前または複数前の要素に対する変化を表す系列である、
付記1に記載の方法。
(付記3)
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ後または複数後の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ後または複数後の要素に対する変化を表す系列である、
付記1に記載の方法。
(付記4)
前記編集距離は、重み付け編集距離であり、以下の要求のうちの一つまたは複数のこと、即ち、
挿入操作について、異なる要素の挿入に対して異なる重みの付与が許可されること、
削除操作について、異なる要素の削除に対して異なる重みの付与が許可されること、及び/又は、
置換操作について、異なる要素ペアの置換に対して異なる重みの付与が許可されることを満たす、
付記1に記載の方法。
(付記5)
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出する処理は、
前記複数のサブ時系列から、所定の閾値より小さい編集距離を有する一つまたは複数のサブ時系列を、前記基準系列と類似するサブ時系列として抽出することを含む、付記1に記載の方法。
(付記6)
変換された時系列を複数のサブ時系列に分割する処理によって分割された各サブ時系列は所定の長さを有し、分割された各サブ時系列の先頭間の間隔は所定のステップ長さであり、前記所定の長さおよび前記所定のステップ長さは前記基準系列の長さと同じであっても異なっていてもよい、付記1乃至5のいずれか一項に記載の方法。
(付記7)
時系列から基準系列と類似するサブ時系列を抽出する装置であって、
前記時系列及び前記基準系列を、それぞれ前記時系列及び前記基準系列の変化傾向を表す系列に変換するように構成される系列変換手段と、
変換された時系列を複数のサブ時系列に分割するように構成されるサブ時系列分割手段と、
前記複数のサブ時系列のうちの各サブ時系列と変換された基準系列との間の編集距離を算出するように構成される編集距離算出手段と、
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出するように構成される類似時系列抽出手段と、を含む装置。
(付記8)
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ前または複数前の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ前または複数前の要素に対する変化を表す系列である、
付記7に記載の装置。
(付記9)
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ後または複数後の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ後または複数後の要素に対する変化を表す系列である、
付記8に記載の装置。
(付記10)
前記編集距離は重み付け編集距離であり、以下の要求のうちの一つまたは複数のこと、即ち、
挿入操作について、異なる要素の挿入に対して異なる重みの付与が許可されること、
削除操作について、異なる要素の削除に対して異なる重みの付与が許可されること、及び/又は、
置換操作について、異なる要素ペアの置換に対して異なる重みの付与が許可されることを満たす、付記7に記載の装置。
(付記11)
前記類似サブ時系列抽出手段は、
前記複数のサブ時系列から、所定の閾値より小さい編集距離を有する一つまたは複数のサブ時系列を、前記基準系列と類似するサブ時系列として抽出するように構成される、付記7に記載の装置。
(付記12)
前記サブ時系列分割手段は、前記分割を、分割された各サブ時系列が所定の長さを有し、分割された各サブ時系列の先頭間の間隔が所定のステップ長さとなるように行うよう構成されており、前記所定の長さおよび前記所定のステップ長さは前記基準系列の長さと同じであっても異なっていてもよい、付記7乃至11のいずれか一項に記載の装置。
(付記13)
コンピュータに、付記1乃至6のいずれか一項に記載の方法の手順を実行させるプログラム。
(付記14)
コンピュータに、付記1乃至6のいずれか一項に記載の方法の手順を実行させるプログラムを記録したコンピュータ読み取り可能な記憶媒体。
About embodiment containing said Example, the following additional remarks are also contained.
Note:
(Appendix 1)
A method of extracting a sub time series similar to a reference series from a time series, wherein a computer
Converting the time series and the reference series into a series representing a change tendency of the time series and the reference series, respectively;
Split the transformed time series into multiple sub time series,
Calculating an edit distance between each sub time series of the plurality of sub time series and the converted reference series;
A method of extracting a sub time series similar to the reference series from the plurality of sub time series based on the calculated editing distance.
(Appendix 2)
The series representing the change tendency of the time series is a series representing a change with respect to an element before one or a plurality of previous elements of the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element one or more before the current element in the reference series.
The method according to appendix 1.
(Appendix 3)
The series representing a change tendency of the time series is a series representing a change with respect to an element after one or a plurality of elements after the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element after one or a plurality of current elements in the reference series.
The method according to appendix 1.
(Appendix 4)
The edit distance is a weighted edit distance and is one or more of the following requirements:
For the insert operation, it is allowed to give different weights to the insertion of different elements,
For the delete operation, different weighting is allowed for the deletion of different elements, and / or
For replacement operations, satisfying that different weights are allowed for replacement of different element pairs.
The method according to appendix 1.
(Appendix 5)
Based on the calculated editing distance, a process of extracting a sub time series similar to the reference series from the plurality of sub time series,
The method according to claim 1, comprising extracting one or more sub time series having an edit distance smaller than a predetermined threshold from the plurality of sub time series as a sub time series similar to the reference series.
(Appendix 6)
Each sub time series divided by the process of dividing the converted time series into a plurality of sub time series has a predetermined length, and the interval between the heads of each divided sub time series is a predetermined step length. The method according to any one of appendices 1 to 5, wherein the predetermined length and the predetermined step length may be the same as or different from a length of the reference sequence.
(Appendix 7)
An apparatus for extracting a sub time series similar to a reference series from a time series,
Series conversion means configured to convert the time series and the reference series into a series representing a change tendency of the time series and the reference series, respectively;
Sub time series dividing means configured to divide the converted time series into a plurality of sub time series;
An edit distance calculating means configured to calculate an edit distance between each sub time series of the plurality of sub time series and the converted reference series;
A similar time series extracting unit configured to extract a sub time series similar to the reference series from the plurality of sub time series based on the calculated editing distance.
(Appendix 8)
The series representing the change tendency of the time series is a series representing a change with respect to an element before one or a plurality of previous elements of the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element one or more before the current element in the reference series.
The apparatus according to appendix 7.
(Appendix 9)
The series representing a change tendency of the time series is a series representing a change with respect to an element after one or a plurality of elements after the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element after one or a plurality of current elements in the reference series.
The apparatus according to appendix 8.
(Appendix 10)
The edit distance is a weighted edit distance and is one or more of the following requirements:
For the insert operation, it is allowed to give different weights to the insertion of different elements,
For the delete operation, different weighting is allowed for the deletion of different elements, and / or
The apparatus according to appendix 7, wherein the replacement operation satisfies that different weighting is permitted for replacement of different element pairs.
(Appendix 11)
The similar sub time series extraction means includes:
The supplementary note 7 is configured to extract one or a plurality of sub time series having an edit distance smaller than a predetermined threshold from the plurality of sub time series as a sub time series similar to the reference series. apparatus.
(Appendix 12)
The sub time series dividing unit performs the division so that each divided sub time series has a predetermined length, and an interval between the heads of each divided sub time series has a predetermined step length. The apparatus according to any one of appendices 7 to 11, wherein the device is configured as described above, and the predetermined length and the predetermined step length may be the same as or different from a length of the reference sequence.
(Appendix 13)
A program that causes a computer to execute the procedure of the method according to any one of appendices 1 to 6.
(Appendix 14)
A computer-readable storage medium storing a program for causing a computer to execute the procedure of the method according to any one of appendices 1 to 6.

Claims (10)

時系列ciから基準系列biと類似するサブ時系列を抽出する方法であって、コンピュータが、
前記時系列ci及び前記基準系列biを、それぞれ、
Figure 0006111543
(ただし、γ=1の場合を除く)に従って、あるいは上式のi−1をi+1で置き換えた式に従って、前記時系列及び前記基準系列の変化傾向を表す系列に変換し、
変換された時系列を複数のサブ時系列に分割し、
前記複数のサブ時系列のうちの各サブ時系列と変換された基準系列との間の編集距離を算出し、
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出することを特徴とする方法。
A method for extracting a sub-time-series similar to the reference sequence b i from the time series c i, computer,
The time series c i and the reference series b i , respectively,
Figure 0006111543
(Except for the case of γ = 1) or according to an equation in which i−1 in the above equation is replaced by i + 1, and converted into a sequence representing a change tendency of the time series and the reference sequence,
Split the transformed time series into multiple sub time series,
Calculating an edit distance between each sub time series of the plurality of sub time series and the converted reference series;
A method of extracting a sub time series similar to the reference series from the plurality of sub time series based on the calculated editing distance.
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ前または複数前の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ前または複数前の要素に対する変化を表す系列である、
請求項1に記載の方法。
The series representing the change tendency of the time series is a series representing a change with respect to an element before one or a plurality of previous elements of the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element one or more before the current element in the reference series.
The method of claim 1.
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ後または複数後の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ後または複数後の要素に対する変化を表す系列である、
請求項1に記載の方法。
The series representing a change tendency of the time series is a series representing a change with respect to an element after one or a plurality of elements after the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element after one or a plurality of current elements in the reference series.
The method of claim 1.
前記編集距離は、重み付け編集距離であり、以下の要求のうちの一つまたは複数のこと、即ち、
挿入操作について、異なる要素の挿入に対して異なる重みの付与が許可されること、
削除操作について、異なる要素の削除に対して異なる重みの付与が許可されること、及び/又は、
置換操作について、異なる要素ペアの置換に対して異なる重みの付与が許可されることを満たす、
請求項1に記載の方法。
The edit distance is a weighted edit distance and is one or more of the following requirements:
For the insert operation, it is allowed to give different weights to the insertion of different elements,
For the delete operation, different weighting is allowed for the deletion of different elements, and / or
For replacement operations, satisfying that different weights are allowed for replacement of different element pairs.
The method of claim 1.
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出する処理は、
前記複数のサブ時系列から、所定の閾値より小さい編集距離を有する一つまたは複数のサブ時系列を、前記基準系列と類似するサブ時系列として抽出することを含む、請求項1に記載の方法。
Based on the calculated editing distance, a process of extracting a sub time series similar to the reference series from the plurality of sub time series,
The method according to claim 1, comprising extracting one or more sub time series having an edit distance smaller than a predetermined threshold from the plurality of sub time series as a sub time series similar to the reference series. .
変換された時系列を複数のサブ時系列に分割する処理によって分割された各サブ時系列は所定の長さを有し、分割された各サブ時系列の先頭間の間隔は所定のステップ長さであり、前記所定の長さおよび前記所定のステップ長さは前記基準系列の長さと同じであっても異なっていてもよい、請求項1乃至5のいずれか一項に記載の方法。 Each sub time series divided by the process of dividing the converted time series into a plurality of sub time series has a predetermined length, and the interval between the heads of each divided sub time series is a predetermined step length. The method according to any one of claims 1 to 5, wherein the predetermined length and the predetermined step length may be the same as or different from a length of the reference sequence. 時系列ciから基準系列biと類似するサブ時系列を抽出する装置であって、
前記時系列ci及び前記基準系列biを、それぞれ、
Figure 0006111543
(ただし、γ=1の場合を除く)に従って、あるいは上式のi−1をi+1で置き換えた式に従って、前記時系列及び前記基準系列の変化傾向を表す系列に変換するように構成される系列変換手段と、
変換された時系列を複数のサブ時系列に分割するように構成されるサブ時系列分割手段と、
前記複数のサブ時系列のうちの各サブ時系列と変換された基準系列との間の編集距離を算出するように構成される編集距離算出手段と、
算出された編集距離に基づいて、前記複数のサブ時系列から前記基準系列と類似するサブ時系列を抽出するように構成される類似時系列抽出手段と、を含む装置。
An apparatus for extracting a sub-time-series similar to the reference sequence b i from the time series c i,
The time series c i and the reference series b i , respectively,
Figure 0006111543
(Except for the case where γ = 1) , or according to an expression in which i−1 in the above expression is replaced by i + 1, a series configured to convert the time series and the reference series into a series representing a change tendency Conversion means;
Sub time series dividing means configured to divide the converted time series into a plurality of sub time series;
An edit distance calculating means configured to calculate an edit distance between each sub time series of the plurality of sub time series and the converted reference series;
A similar time series extracting unit configured to extract a sub time series similar to the reference series from the plurality of sub time series based on the calculated editing distance.
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ前または複数前の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ前または複数前の要素に対する変化を表す系列である、
請求項7に記載の装置。
The series representing the change tendency of the time series is a series representing a change with respect to an element before one or a plurality of previous elements of the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element one or more before the current element in the reference series.
The apparatus according to claim 7.
前記時系列の変化傾向を表す系列は、前記時系列における現在要素の一つ後または複数後の要素に対する変化を表す系列であり、
前記基準系列の変化傾向を表す系列は、前記基準系列における現在要素の一つ後または複数後の要素に対する変化を表す系列である、
請求項8に記載の装置。
The series representing a change tendency of the time series is a series representing a change with respect to an element after one or a plurality of elements after the current element in the time series,
The series representing a change tendency of the reference series is a series representing a change with respect to an element after one or a plurality of current elements in the reference series.
The apparatus according to claim 8.
コンピュータに、請求項1乃至6のいずれか一項に記載の方法の手順を実行させるプログラム。 The program which makes a computer perform the procedure of the method as described in any one of Claims 1 thru | or 6.
JP2012156266A 2011-07-14 2012-07-12 Method and apparatus for extracting similar sub time series Expired - Fee Related JP6111543B2 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN201110203979.9A CN102880621B (en) 2011-07-14 2011-07-14 The method and apparatus extracting similar Time Sub-series
CN201110203979.9 2011-07-14

Publications (2)

Publication Number Publication Date
JP2013025805A JP2013025805A (en) 2013-02-04
JP6111543B2 true JP6111543B2 (en) 2017-04-12

Family

ID=47481949

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012156266A Expired - Fee Related JP6111543B2 (en) 2011-07-14 2012-07-12 Method and apparatus for extracting similar sub time series

Country Status (2)

Country Link
JP (1) JP6111543B2 (en)
CN (1) CN102880621B (en)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103577562B (en) * 2013-10-24 2016-08-31 河海大学 A kind of many measuring periods sequence similarity analyzes method
CN104714953A (en) * 2013-12-12 2015-06-17 日本电气株式会社 Time series data motif identification method and device
CN104809134B (en) * 2014-01-27 2018-03-09 国际商业机器公司 The method and apparatus for detecting the abnormal subsequence in data sequence
CN105224543A (en) 2014-05-30 2016-01-06 国际商业机器公司 For the treatment of seasonal effect in time series method and apparatus
CN108573059B (en) * 2018-04-26 2021-02-19 哈尔滨工业大学 A time series classification method and device based on feature sampling
CN109902703B (en) * 2018-09-03 2021-09-21 华为技术有限公司 Time series abnormity detection method and device
CN109543083B (en) * 2018-11-19 2020-12-22 国网陕西省电力公司电力科学研究院 A detection method for abnormal data in real-time data of multivariate power grid
CN111027606B (en) * 2019-11-29 2022-05-31 中国科学院空间应用工程与技术中心 Multi-mode time series anomaly detection method, storage medium and equipment
CN114282590B (en) * 2020-11-18 2025-10-21 阿里巴巴集团控股有限公司 Method, system and readable medium for distance measurement of time series
CN119557800B (en) * 2024-11-08 2025-10-21 南昌君胜设计有限公司 A multi-time series monitoring data anomaly detection method and system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000194713A (en) * 1998-12-25 2000-07-14 Nippon Telegr & Teleph Corp <Ntt> Character string search method and apparatus, and storage medium storing character string search program
CN101996174A (en) * 2009-08-11 2011-03-30 上海汉光知识产权数据科技有限公司 Time series analysis method of patent documentations
CN102004795B (en) * 2010-12-08 2012-11-21 中国科学院自动化研究所 Hand language searching method

Also Published As

Publication number Publication date
JP2013025805A (en) 2013-02-04
CN102880621A (en) 2013-01-16
CN102880621B (en) 2017-03-01

Similar Documents

Publication Publication Date Title
JP6111543B2 (en) Method and apparatus for extracting similar sub time series
JP6299759B2 (en) Prediction function creation device, prediction function creation method, and program
JP7040319B2 (en) Operation management device, destination recommended method and destination recommended program
JP2015230570A (en) Learning model creation device, determination system, and learning model creation method
WO2013094003A1 (en) Method, program, and device for determining software installation sequence
JP7014230B2 (en) Information processing equipment, information processing methods and programs
CN118568256B (en) Method and device for evaluating text classification performance of large language model
CN113516185A (en) Model training method and device, electronic equipment and storage medium
JPWO2016157275A1 (en) Computer and graph data generation method
CN103729530B (en) Device and method for processing sequence
JP2020095397A (en) Optimization device, optimization program and optimization method
JP6281491B2 (en) Text mining device, text mining method and program
JP6309795B2 (en) Information processing apparatus, information processing method, and program
JP6366033B2 (en) Optimization method of IF statement in program
US20160357655A1 (en) Performance information generating method, information processing apparatus and computer-readable storage medium storing performance information generation program
JP2014174728A (en) Cost calculation device, cost calculation method, and program
JP2020021343A (en) Analysis apparatus, analysis method and program
WO2015114830A1 (en) Computer and graph-data generation method
JP6191440B2 (en) Script management program, script management apparatus, and script management method
JP2005222445A (en) Information processing method and analysis device in data mining
CN116304048B (en) ICD encoding methods, devices and electronic equipment
JP6981860B2 (en) Series data analysis device, series data analysis method and program
JP6473112B2 (en) Speech recognition accuracy estimation apparatus, speech recognition accuracy estimation method, and speech recognition accuracy estimation program
JP7544274B2 (en) Accumulation calculation device, accumulation calculation method, and program
US7933853B2 (en) Computer-readable recording medium, apparatus and method for calculating scale-parameter

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20150406

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20160224

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20160301

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20160425

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20160906

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20161130

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20161208

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170214

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170227

R150 Certificate of patent or registration of utility model

Ref document number: 6111543

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees