[go: up one dir, main page]

JP2010128674A - Computer network, and apparatus, method, and program for detecting abnormality - Google Patents

Computer network, and apparatus, method, and program for detecting abnormality Download PDF

Info

Publication number
JP2010128674A
JP2010128674A JP2008301045A JP2008301045A JP2010128674A JP 2010128674 A JP2010128674 A JP 2010128674A JP 2008301045 A JP2008301045 A JP 2008301045A JP 2008301045 A JP2008301045 A JP 2008301045A JP 2010128674 A JP2010128674 A JP 2010128674A
Authority
JP
Japan
Prior art keywords
invariant
abnormality detection
abnormality
processing unit
probability density
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2008301045A
Other languages
Japanese (ja)
Inventor
Toshiaki Hirose
俊亮 広瀬
Kenji Yamanishi
健司 山西
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2008301045A priority Critical patent/JP2010128674A/en
Publication of JP2010128674A publication Critical patent/JP2010128674A/en
Withdrawn legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a computer network, etc., for adequately detecting an abnormality degree of a whole system, while considering symmetry in exchanging elements. <P>SOLUTION: An abnormality detecting apparatus 11 is connected to the computer network 1 and includes: a data input processing part 201 for generating input data by defining a feature quantity, which is obtained by computers 11-1n connected to the computer network, as matrixes or tensors; an invariant calculation processing part 202 for calculating an invariant being an invariant quantity even when the elements are exchanged in the input data; and abnormality detecting means 203-205 for detecting whether an abnormality occurs or not, based on the invariant. <P>COPYRIGHT: (C)2010,JPO&INPIT

Description

本発明は、要素が相互に関連して動作するシステムにおける異常の検出に関し、特にコンピュータネットワークにおけるワーム、ウイルス、マルウェアなどのような不正プログラムに起因する異常の検出に関する。   The present invention relates to the detection of anomalies in systems where elements operate in conjunction with one another, and more particularly to the detection of anomalies due to malicious programs such as worms, viruses, malware, etc. in computer networks.

たとえばコンピュータネットワークなどのように、接続された多数の要素が相互に関連して動作するシステムでは、その動作において発生した異常を早急に検出する必要がある。その異常検出は、特定の要素の性質に依存しないものでなければならない。   In a system in which a large number of connected elements operate in relation to each other such as a computer network, for example, it is necessary to quickly detect an abnormality occurring in the operation. The anomaly detection must be independent of the nature of the particular element.

その一つの例が、コンピュータネットワークにおいてワーム、ウイルス、マルウェアなどのような不正プログラムに起因する異常の検出である。該ネットワークを構成するコンピュータにワームが急激に拡散すると、該ネットワーク内の通信トラフィックは急激に増大する。そのため、該ネットワークのノードであるコンピュータおよび各種ネットワーク機器間でのデータ送信量を時刻と共に記録し、そのデータを入力として通信トラフィックの急増を検出し、これによってワームの拡散を検出することを考える。   One example is the detection of anomalies due to malicious programs such as worms, viruses, malware, etc. in computer networks. When the worm spreads rapidly to the computers constituting the network, the communication traffic in the network increases rapidly. Therefore, it is considered to record the data transmission amount between the computer and the various network devices as nodes of the network together with the time, and to detect the sudden increase of communication traffic using the data as input, thereby detecting the spread of the worm.

上記に関連する技術文献として、次に示すものがある。特許文献1には、ネットワークの特徴量を成分に持つ行列の最大固有ベクトルを入力としてベクトルの通常の状態を学習し、通常のベクトルと大きく異なるものを異常として検出するという技術が記載されている。特許文献2には、データが入力される前後の確率密度の間の距離関数を外れ値度として計算し、各データの外れ値度から該データが不正であるか否かを検出するという技術が記載されている。   The following are technical documents related to the above. Patent Document 1 describes a technique of learning a normal state of a vector by using a maximum eigenvector of a matrix having a network feature amount as a component as input, and detecting an abnormality that is significantly different from the normal vector as an abnormality. Patent Document 2 discloses a technique of calculating a distance function between probability densities before and after data is input as an outlier degree, and detecting whether the data is illegal from the outlier degree of each data. Are listed.

また特許文献3には、人間の顔面の画像を認識する方法で、顔の表情の変形に伴う統計的な変形データを使用して認識精度を向上するという技術が記載されている。特許文献4には、過去一定期間に集計されたトラフィック量などのデータを指標データとして、トラフィック量の異常を検知する方法の一例が記載されている。特許文献5には、印鑑照合システムで、安定的な特徴点を選択することによって、失敗を減らして高精度な位置合わせを行うという技術が記載されている。   Japanese Patent Application Laid-Open No. 2004-228561 describes a technique for improving recognition accuracy using statistical deformation data associated with deformation of facial expressions in a method for recognizing an image of a human face. Patent Document 4 describes an example of a method for detecting an abnormality in traffic volume by using data such as traffic volume aggregated in a certain past period as index data. Japanese Patent Application Laid-Open No. 2004-228561 describes a technique for performing highly accurate alignment by reducing failure by selecting a stable feature point in a seal collation system.

特開2005−216066号公報Japanese Patent Application Laid-Open No. 2005-216066 特開2004−078981号公報JP 2004-078981 A 特開2005−208850号公報JP 2005-208850 A 特開2008−022498号公報JP 2008-022498 A 特開平09−044655号公報JP 09-045455 A

上述のようなコンピュータネットワーク上のワームなどに起因する通信トラフィックの異常の検出で、考慮すべきネットワークの性質として次に示す二点が挙げられる。一つはネットワークの対称性である。異常として検出されるべきなのは、データ送信の偏りの変化である。より具体的には、少数の要素(コンピュータ)間でのみデータの交換がなされていたのがワームの蔓延によって全要素間でデータが交換されるようになったなどのようなことが、異常として検出されるべき現象である。   There are the following two points as the nature of the network that should be taken into account when detecting abnormalities in communication traffic caused by worms on the computer network as described above. One is network symmetry. What should be detected as an anomaly is a change in bias in data transmission. More specifically, data was exchanged only between a small number of elements (computers), but data was exchanged between all elements due to the spread of worms. It is a phenomenon that should be detected.

一方で、ある時刻では要素Aから要素BにXという量のデータの送信が観測されて次の時刻には要素Cから要素Dに同じ量のデータの送信が観測されたという場合、これを異常として検出するのは適切ではない。なぜなら、これはデータを送受信する要素の組み合わせが時間によって変わったというだけであり、データの送受信の偏り方(この例では二つの要素間でXという量のデータが遣り取りされる)が変化していないからである。   On the other hand, if transmission of the amount X of data is observed from element A to element B at a certain time and transmission of the same amount of data from element C to element D is observed at the next time, this is abnormal. It is not appropriate to detect as. This is because the combination of elements that transmit and receive data has changed over time, and the bias of data transmission and reception (in this example, an amount of data of X is exchanged between two elements) has changed. Because there is no.

ここでいう対称性とは、要素(コンピュータ等)の入れ替えに対して、たとえば通信トラフィックなどのような特徴量が不変であるという性質をいう。この場合は、この要素の入れ替えに対する対称性を考慮した異常検出が必要である。上記の例ではデータ送信の偏り方が変化する、という異常がこれに該当する。これと同様の対称性は、これ以外の場合についても適用されうる。   The symmetry here refers to the property that, for example, the feature quantity such as communication traffic is not changed with respect to replacement of elements (computer or the like). In this case, it is necessary to detect an abnormality in consideration of symmetry with respect to the replacement of this element. In the above example, the abnormality that the bias of data transmission changes corresponds to this. Similar symmetry can be applied to other cases.

考慮すべきネットワークの性質のもう一つは、ネットワーク上のトラフィック量等は時刻と共に変化し、どの要素とどの要素が繋がっているかというネットワークの構造も時間と共に変化するという点である。そのため、異常であると判断されるべき状態も時間によって異なる。たとえば、同じトラフィック量であっても、深夜の時間帯にそのトラフィック量が発生すれば異常であるが、昼間に発生すれば通常の量である、などといった状況もありうる。   Another characteristic of the network to be considered is that the amount of traffic on the network changes with time, and the network structure of which elements are connected to each other also changes with time. Therefore, the state that should be determined to be abnormal also varies with time. For example, even if the traffic volume is the same, it may be abnormal if the traffic volume occurs at midnight, but it may be a normal volume if it occurs in the daytime.

上記の2点の性質のうち、時間変化を考慮に入れた異常の検出は、特許文献1などで可能である。しかしながら、要素の入れ替えの対称性を考慮して、特定の要素の性質に依らないシステム全体の挙動の異常を検出することは、従来の技術では不可能である。前述の特許文献1〜5のいずれにも、このような要素の入れ替えの対称性を考慮した異常の検出が可能な技術は記載されていない。   Of the above two properties, the detection of an abnormality taking into account the change in time can be performed in Patent Document 1 or the like. However, it is impossible to detect abnormalities in the behavior of the entire system regardless of the properties of specific elements in consideration of the symmetry of element replacement. None of the above-mentioned patent documents 1 to 5 describes a technique capable of detecting an abnormality in consideration of the symmetry of such element replacement.

本発明の目的は、要素の入れ替えの対称性を考慮しつつシステム全体の異常度を的確に検出することを可能とするコンピュータネットワーク、異常検出装置、異常検出方法および異常検出プログラムを提供することにある。   An object of the present invention is to provide a computer network, an abnormality detection device, an abnormality detection method, and an abnormality detection program capable of accurately detecting the degree of abnormality of the entire system in consideration of symmetry of element replacement. is there.

上記目的を達成するため、本発明に係るコンピュータネットワークは、複数台のコンピュータが相互に接続されてなるコンピュータネットワークであって、複数台のコンピュータのうち少なくとも1台が、ネットワーク全体の通信トラフィック等の特徴量を検出する第1の特徴量取得部と、特徴量から異常検出に係る計算を行う異常検出部とを有する異常検出装置であり、複数台のコンピュータのうち異常検出装置でない他の全てのものが、特徴量を検出して異常検出部に転送する第2の特徴量取得部を有し、異常検出装置の異常検出部が、第1および第2の特徴量取得部で取得された特徴量を行列もしくはテンソルとして入力データを作成するデータ入力処理部と、入力データの中で要素を入れ替えても不変な量である不変量を算出する不変量計算処理部と、不変量に基づいて異常が発生したか否かを検出する異常検出手段とを有することを特徴とする。   In order to achieve the above object, a computer network according to the present invention is a computer network in which a plurality of computers are connected to each other, and at least one of the plurality of computers has communication traffic or the like of the entire network. An abnormality detection device having a first feature amount acquisition unit that detects a feature amount and an abnormality detection unit that performs calculation related to abnormality detection from the feature amount, and all other computers that are not abnormality detection devices among a plurality of computers The apparatus has a second feature amount acquisition unit that detects a feature amount and transfers the feature amount to the abnormality detection unit, and the abnormality detection unit of the abnormality detection device acquires the feature acquired by the first and second feature amount acquisition units. A data input processing unit that creates input data with quantities as matrices or tensors, and an invariant that calculates invariants that are invariable even if elements are replaced in the input data. And having a quantity computing unit, and an abnormality detecting means for detecting whether an abnormality has occurred based on invariants.

上記目的を達成するため、本発明に係る異常検出装置は、コンピュータネットワークに接続されたコンピュータからなる異常検出装置であって、コンピュータネットワークに接続された他のコンピュータで取得された通信トラフィック等の特徴量を行列もしくはテンソルとして入力データを作成するデータ入力処理部と、入力データの中で要素を入れ替えても不変な量である不変量を算出する不変量計算処理部と、不変量に基づいて異常が発生したか否かを検出する異常検出手段とを有することを特徴とする。   In order to achieve the above object, an abnormality detection apparatus according to the present invention is an abnormality detection apparatus including a computer connected to a computer network, and features such as communication traffic acquired by another computer connected to the computer network. A data input processing unit that creates input data with quantities as matrices or tensors, an invariant calculation processing unit that calculates invariants that are invariable even if elements are replaced in the input data, and abnormalities based on invariants And an abnormality detecting means for detecting whether or not an error has occurred.

上記目的を達成するため、本発明に係る異常検出方法は、複数台のコンピュータが相互に接続されてなるコンピュータネットワークにあって、コンピュータネットワークに接続されたコンピュータで発生した異常を検出する方法であって、コンピュータネットワークに接続されたコンピュータの特徴量取得部が、通信トラフィック等の特徴量を取得し、特徴量取得部が、取得した特徴量をコンピュータネットワークに接続された異常検出装置に転送し、異常検出装置のデータ入力処理部が、転送された特徴量から行列もしくはテンソルとして入力データを作成し、異常検出装置の不変量計算処理部が、入力データの中で要素を入れ替えても不変な量である不変量を算出し、異常検出装置の異常検出手段が、不変量に基づいて異常が発生したか否かを検出することを特徴とする。   In order to achieve the above object, an abnormality detection method according to the present invention is a method for detecting an abnormality occurring in a computer connected to a computer network in a computer network in which a plurality of computers are connected to each other. The feature amount acquisition unit of the computer connected to the computer network acquires the feature amount such as communication traffic, and the feature amount acquisition unit transfers the acquired feature amount to the abnormality detection device connected to the computer network, The data input processing unit of the anomaly detection device creates input data as a matrix or tensor from the transferred feature values, and the invariant calculation processing unit of the anomaly detection device does not change even if elements are replaced in the input data Whether the abnormality detection means of the abnormality detection device has an abnormality based on the invariant Or and detecting a.

上記目的を達成するため、本発明に係る異常検出プログラムは、コンピュータネットワークに接続された異常検出装置が備えるコンピュータに、コンピュータネットワークに接続されたコンピュータで取得された通信トラフィック等の特徴量から行列もしくはテンソルとして入力データを作成する手順と、入力データの中で要素を入れ替えても不変な量である不変量を算出する手順と、不変量に基づいて異常が発生したか否かを検出する手順とを実行させることを特徴とする異常検出プログラム。   In order to achieve the above object, an abnormality detection program according to the present invention provides a computer with an abnormality detection device connected to a computer network, a matrix or a feature amount such as communication traffic acquired by a computer connected to the computer network. A procedure for creating input data as a tensor, a procedure for calculating an invariant that is an invariant even if elements are replaced in the input data, and a procedure for detecting whether an abnormality has occurred based on the invariant An abnormality detection program characterized in that is executed.

本発明は、上述したように要素を入れ替えても不変な量である不変量を算出してから、この不変量の確率密度から外れ値スコアを算出して、そこから異常が発生したか否かを検出するように構成したので、要素の入れ替えの対称性は考慮される。これによって、要素の入れ替えの対称性を考慮しつつシステム全体の異常度を的確に検出することを可能とするという、従来にない優れたコンピュータネットワーク、異常検出装置、異常検出方法および異常検出プログラムを提供することができる。   As described above, the present invention calculates an invariant that is an invariant even if elements are replaced as described above, calculates an outlier score from the probability density of the invariant, and determines whether or not an abnormality has occurred Therefore, the symmetry of element replacement is taken into consideration. As a result, an unprecedented excellent computer network, abnormality detection device, abnormality detection method, and abnormality detection program that enable accurate detection of the degree of abnormality of the entire system while considering symmetry of element replacement Can be provided.

(第1の実施形態)
以下、本発明の実施形態の構成について添付図1および2に基づいて説明する。
最初に、本実施形態の基本的な内容について説明し、その後でより具体的な内容について説明する。
本実施形態に係るコンピュータネットワーク1は、複数台のコンピュータ11〜1nが相互に接続されてなる。そのうちの1台であるコンピュータ11が、ネットワーク全体の特徴量を検出する第1の特徴量取得部115と、特徴量から異常検出に係る計算を行う異常検出部116とを有する異常検出装置である。異常検出装置でないコンピュータ12〜1nは、特徴量を検出して異常検出部に転送する第2の特徴量取得部125のみを有する。そしてコンピュータ11の異常検出部116は、特徴量取得部115および125で取得された特徴量を行列もしくはテンソルとして入力データを作成するデータ入力処理部201と、入力データの中で要素を入れ替えても不変な量である不変量を算出する不変量計算処理部202と、不変量に基づいて異常が発生したか否かを検出する異常検出手段とを有する。
(First embodiment)
Hereinafter, the configuration of the embodiment of the present invention will be described with reference to FIGS.
First, the basic content of the present embodiment will be described, and then more specific content will be described.
A computer network 1 according to the present embodiment includes a plurality of computers 11 to 1n connected to each other. The computer 11, which is one of them, is an abnormality detection device having a first feature amount acquisition unit 115 that detects a feature amount of the entire network and an abnormality detection unit 116 that performs calculation related to abnormality detection from the feature amount. . The computers 12 to 1n that are not the abnormality detection device include only the second feature amount acquisition unit 125 that detects the feature amount and transfers it to the abnormality detection unit. Then, the abnormality detection unit 116 of the computer 11 replaces the elements in the input data with the data input processing unit 201 that creates input data using the feature amounts acquired by the feature amount acquisition units 115 and 125 as a matrix or a tensor. An invariant calculation processing unit 202 that calculates an invariant that is an invariant, and an abnormality detection unit that detects whether an abnormality has occurred based on the invariant.

ここでいう異常検出手段は、不変量の確率密度を逐次的に求める分布学習処理部203と、確率密度を用いて不変量の異常度を表す第1の外れ値スコアを算出するスコア計算処理部204と、第1の外れ値スコアを用いて異常が発生したか否かを検出する異常検出処理部205とを有する。   Here, the abnormality detection means includes a distribution learning processing unit 203 that sequentially obtains the invariant probability density, and a score calculation processing unit that calculates a first outlier score representing the invariant abnormality degree using the probability density. 204 and an abnormality detection processing unit 205 that detects whether or not an abnormality has occurred using the first outlier score.

そしてコンピュータ11〜1nの特徴量取得部115および125は、これらのコンピュータの相互間の通信トラフィックを特徴量として取得して異常検出部に転送するトラフィック取得部115および125である。   The feature amount acquisition units 115 and 125 of the computers 11 to 1n are traffic acquisition units 115 and 125 that acquire communication traffic between these computers as a feature amount and transfer it to the abnormality detection unit.

この構成を備えることにより、本実施形態は、要素の入れ替えの対称性を考慮しつつシステム全体の異常度を的確に検出することが可能となる。
以下、これをより詳細に説明する。
By including this configuration, the present embodiment can accurately detect the degree of abnormality of the entire system while taking into account the symmetry of element replacement.
Hereinafter, this will be described in more detail.

図2は、本発明の実施形態に係るコンピュータネットワーク1について示す説明図である。コンピュータネットワーク1には、n台(nは2以上の整数)のコンピュータ11〜1nが相互に接続されている。本実施形態では、これらのコンピュータ11〜1nをノード、そして各ノード間の通信トラフィックをリンクとしている。そして、それらのノードの中の任意の1つであるコンピュータ11に、他のコンピュータ12〜1nから通信トラフィックに関する情報が転送され、コンピュータ11上で後述する異常検出に係る計算が行われる。このため、コンピュータ11を異常検出装置ともいう。   FIG. 2 is an explanatory diagram showing the computer network 1 according to the embodiment of the present invention. The computer network 1 is connected to n (n is an integer of 2 or more) computers 11 to 1n. In this embodiment, these computers 11 to 1n are nodes, and communication traffic between the nodes is a link. Then, information relating to communication traffic is transferred from the other computers 12 to 1n to the computer 11, which is an arbitrary one of those nodes, and calculation related to abnormality detection described later is performed on the computer 11. For this reason, the computer 11 is also referred to as an abnormality detection device.

図1は、図2で示したコンピュータ11および12〜1n内部の構成をより詳細に示す説明図である。異常検出装置であるコンピュータ11は、プログラムを実行する主体であるCPU(Central Processing Unit)111と、CPU111が実行するプログラムが読み込まれて記憶されるRAM(Random Access Memory)112と、プログラムおよびデータが記憶される不揮発性の大容量記憶装置であるHDD(Hard Disk Unit)113と、コンピュータネットワーク1に接続して他のコンピュータ等とのデータ通信を行うネットワークアダプタ114とを備える通常のコンピュータ装置である。   FIG. 1 is an explanatory diagram showing the internal configuration of the computers 11 and 12-1n shown in FIG. 2 in more detail. The computer 11 which is an abnormality detection device includes a CPU (Central Processing Unit) 111 which is a main body for executing a program, a RAM (Random Access Memory) 112 in which a program executed by the CPU 111 is read and stored, and a program and data. It is an ordinary computer device comprising a hard disk unit (HDD) 113 that is a nonvolatile mass storage device that is stored and a network adapter 114 that is connected to the computer network 1 and performs data communication with other computers and the like. .

またCPU111は、本実施形態に係るコンピュータプログラムであるトラフィック取得部115と、異常検出部116とを実行する。いずれも、HDD113からRAM112に読み出され、CPU111によって実行される。トラフィック取得部115は、ネットワークアダプタ114で行われる他のコンピュータとの通信トラフィックを検出し、異常検出部116はトラフィック取得部115によって取得された通信トラフィックから異常検出に係る計算を行う。   Further, the CPU 111 executes a traffic acquisition unit 115 and an abnormality detection unit 116 which are computer programs according to the present embodiment. Both are read from the HDD 113 to the RAM 112 and executed by the CPU 111. The traffic acquisition unit 115 detects communication traffic with other computers performed by the network adapter 114, and the abnormality detection unit 116 performs calculation related to abnormality detection from the communication traffic acquired by the traffic acquisition unit 115.

異常検出装置ではないコンピュータ12〜1nも、コンピュータ11と同じく、CPU121と、RAM122と、HDD123と、ネットワークアダプタ124とを備える通常のコンピュータ装置である。これら各部の機能は、コンピュータ11の同名の構成部と等しい。図2にはコンピュータ12のみを示しているが、図2に示していないコンピュータ13〜1nの構成もコンピュータ12と同一である。   Similarly to the computer 11, the computers 12 to 1n that are not abnormality detection devices are normal computer devices including a CPU 121, a RAM 122, an HDD 123, and a network adapter 124. The functions of these units are the same as those of the computer 11 having the same name. Although only the computer 12 is shown in FIG. 2, the configurations of the computers 13 to 1n not shown in FIG. 2 are the same as the computer 12.

CPU121は、本実施形態に係るコンピュータプログラムであるトラフィック取得部125を実行する。トラフィック取得部125は、HDD123からRAM112に読み出され、CPU121によって実行される。トラフィック取得部125は、ネットワークアダプタ124で行われる他のコンピュータとの通信トラフィックを検出し、検出された通信トラフィックについての情報をコンピュータ11の異常検出部116に転送する。   The CPU 121 executes a traffic acquisition unit 125 that is a computer program according to the present embodiment. The traffic acquisition unit 125 is read from the HDD 123 to the RAM 112 and executed by the CPU 121. The traffic acquisition unit 125 detects communication traffic with other computers performed by the network adapter 124, and transfers information about the detected communication traffic to the abnormality detection unit 116 of the computer 11.

コンピュータ11の異常検出部116は、コンピュータ12〜1nのトラフィック取得部125から転送された通信トラフィックに係る情報を、自らのトラフィック取得部115が取得した情報と共に利用して、異常検出に係る計算を行うのである。   The abnormality detection unit 116 of the computer 11 uses the information related to the communication traffic transferred from the traffic acquisition unit 125 of the computers 12 to 1n together with the information acquired by the own traffic acquisition unit 115 to perform calculation related to the abnormality detection. Do it.

コンピュータ12〜1nは、各々サーバであってもクライアントであってもよい。トラフィック取得部125は、該コンピュータで行われる他の処理と並行して、通信トラフィックの検出および検出された通信トラフィックについての情報の転送を行う。異常検出装置であるコンピュータ11もまた、サーバであってもクライアントであってもよいし、ネットワーク管理専門の機器としてもよい。またトラフィック取得部115および異常検出部116による処理をコンピュータ11で行われる他の処理と並行して行うものとしてもよい。   Each of the computers 12 to 1n may be a server or a client. The traffic acquisition unit 125 detects communication traffic and transfers information about the detected communication traffic in parallel with other processing performed by the computer. The computer 11 serving as the abnormality detection device may also be a server or a client, or may be a device specialized for network management. The processing by the traffic acquisition unit 115 and the abnormality detection unit 116 may be performed in parallel with other processing performed by the computer 11.

(不変量の算出と異常の検出)
図3は、図1に示した異常検出部116の構成をより詳しく説明する説明図である。異常検出部116は、システム全体の特徴量から入力データを作成するデータ入力処理部201と、作成された入力データから要素入れ替えに対して不変な特徴量である不変量を算出する不変量計算処理部202と、算出された不変量の確率密度を逐次的に求める分布学習処理部203と、不変量および更新された確率密度から異常度を表すスコアを算出するスコア計算処理部204と、算出されたスコアから異常が発生したか否かを検出する異常検出処理部205とからなる。各々の処理部による処理の詳細については後述する。
(Invariant calculation and abnormality detection)
FIG. 3 is an explanatory diagram for explaining the configuration of the abnormality detection unit 116 shown in FIG. 1 in more detail. The anomaly detection unit 116 includes a data input processing unit 201 that creates input data from feature quantities of the entire system, and an invariant calculation process that calculates invariants that are invariant feature quantities with respect to element replacement from the created input data. 202, a distribution learning processing unit 203 for sequentially obtaining the calculated invariant probability density, a score calculation processing unit 204 for calculating a score representing the degree of abnormality from the invariant and the updated probability density, and And an abnormality detection processing unit 205 for detecting whether an abnormality has occurred from the score. Details of the processing by each processing unit will be described later.

図3のデータ入力処理部201では、システム全体の特徴量から入力データを作成する。ここでいうシステム全体の特徴量とは、各ノード(コンピュータ11〜1n)間のトラフィック量の集合であり、トラフィック取得部115および125から異常検出部116に入力される。トラフィック量の入力データは時刻と共に逐次的に入力されるか、もしくはそのデータが発生した時刻に関する情報が付与されている。データ入力処理部201は、そこから入力データを作成する。   In the data input processing unit 201 in FIG. 3, input data is created from feature quantities of the entire system. The feature amount of the entire system here is a set of traffic amounts between the nodes (computers 11 to 1n), and is input from the traffic acquisition units 115 and 125 to the abnormality detection unit 116. The traffic volume input data is sequentially input along with the time, or information on the time when the data is generated is given. The data input processing unit 201 creates input data therefrom.

トラフィック量の入力データはテンソル型でもよいが、以後は該入力データが行列型である場合を例にとって説明する。前述のように、n台のコンピュータ11〜1nをノード、そして各ノード間の通信トラフィックをリンクとしており、そしてi番目のノードとj番目のノードの間で時刻tに観測されたトラフィックをAij(t)とすると、時刻tにおける入力データはAij(t)をi行j列目の成分とするn次元の行列A(t)で表される。ただし1≦i≦n、1≦j≦nである。   The input data of the traffic amount may be a tensor type, but hereinafter, a case where the input data is a matrix type will be described as an example. As described above, n computers 11 to 1n are nodes, communication traffic between the nodes is a link, and traffic observed at time t between the i-th node and the j-th node is Aij ( t), the input data at time t is represented by an n-dimensional matrix A (t) having Aij (t) as a component of i-th row and j-th column. However, 1 ≦ i ≦ n and 1 ≦ j ≦ n.

即ち、入力データA(t)はコンピュータネットワーク1を構成するn台のコンピュータ11〜1nで時刻tに観測された相互間の通信トラフィックを表すn次元の行列である。不変量計算処理部202は、データ入力処理部201で入力されたA(t)に対して、要素を入れ替えても(iおよびjの数値を変えても)不変な量である不変量E(t)を、次のようにして求める。   That is, the input data A (t) is an n-dimensional matrix representing communication traffic observed between the n computers 11 to 1n constituting the computer network 1 at time t. The invariant calculation processing unit 202 is an invariant E (which is an invariable amount even if the elements are changed (the values of i and j are changed) with respect to A (t) input by the data input processing unit 201. t) is determined as follows.

行列A(t)で、i番目に大きい固有値をλi(t)、全ての固有値を並べたベクトルをλ(t)、行列式及びトレースを各々det[A(t)]、tr[A(t)]とする。det[A(t)]およびtr[A(t)]は、詳細には下式のように定義される。   In the matrix A (t), the i-th largest eigenvalue is λi (t), the vector in which all eigenvalues are arranged is λ (t), the determinant and the trace are det [A (t)], tr [A (t )]. In detail, det [A (t)] and tr [A (t)] are defined as the following equations.

Figure 2010128674
Figure 2010128674

このとき、例えば以下のようにして不変量E(t)を求めることができる。

Figure 2010128674
(fは任意の関数、E(t)はスカラー) At this time, for example, the invariant E (t) can be obtained as follows.
Figure 2010128674
(F is an arbitrary function, E (t) is a scalar)

Figure 2010128674
(fは任意の関数、E(t)はスカラー)
Figure 2010128674
(F is an arbitrary function, E (t) is a scalar)

Figure 2010128674
(E(t)はn次元のベクトル)
Figure 2010128674
(E (t) is an n-dimensional vector)

行列A(t)のi番目に大きい固有値をλi(t)、それに対応する固有ベクトルをui(t)とすると、λi(t)に対応する固有方程式は以下のようになる。

Figure 2010128674
When the i-th largest eigenvalue of the matrix A (t) is λi (t) and the corresponding eigenvector is ui (t), the eigenequation corresponding to λi (t) is as follows.
Figure 2010128674

要素を入れ替える変換行列をUとすると、要素を入れ替える変換の下で行列、固有ベクトル、固有値はそれぞれ下式に示したようになる。ここで行列U†は、行列Uを転置し、かつ各成分の複素共役をとった行列を表す。そのため、U†U=1となる。

Figure 2010128674
If the transformation matrix for exchanging elements is U, the matrix, eigenvector, and eigenvalue under the transformation for exchanging elements are as shown in the following equations. Here, the matrix U † represents a matrix obtained by transposing the matrix U and taking the complex conjugate of each component. Therefore, U † U = 1.
Figure 2010128674

数5の左辺および右辺に左からUをかければ、下式が得られる。

Figure 2010128674
If U is applied from the left to the left side and the right side of Equation 5, the following equation is obtained.
Figure 2010128674

U†U=1であることから、不変量E(t)は要素の入れ替えに対して不変な量であることがわかる。   Since U † U = 1, it can be seen that the invariant E (t) is an invariant with respect to element replacement.

ここで計算されるE(t)は、要素間の相関を考慮に入れたシステム全体を表す量になっている。なぜならば、E(t)はシステム全体の特徴量を用いて算出されるので要素間の相関が考慮されており、かつ、特定の要素に依存せず(要素の入れ替えに対して不変な)システム全体を表す量になっているからである。   The E (t) calculated here is an amount that represents the entire system taking into account the correlation between elements. This is because E (t) is calculated using the feature quantity of the entire system, so that the correlation between elements is taken into account, and it does not depend on a specific element (it is invariant to element replacement). This is because the amount represents the whole.

図3で示した分布学習処理部203は、次のようにして不変量E(t)の分布を学習する。時刻tにおけるE(t)の分布をpt(E|θt)とすると、分布学習処理部203はE(t)が入力されるたびにpt(E|θt)を逐次的に更新する。θtは分布のパラメータを表す。   The distribution learning processing unit 203 shown in FIG. 3 learns the distribution of the invariant E (t) as follows. If the distribution of E (t) at time t is pt (E | θt), the distribution learning processing unit 203 sequentially updates pt (E | θt) every time E (t) is input. θt represents a distribution parameter.

pt(E|θt)は、例えば、E(t)がベクトルλ(t)であって多次元正規分布を用いた場合、下式のように表記できる。

Figure 2010128674
ここでΣtはλ(t)の分散を表す行列型パラメータで、μ(t)はλ(t)の平均を表すベクトル型のパラメータである。θtは、これらのパラメータをまとめて表記したものである。 For example, when E (t) is a vector λ (t) and a multidimensional normal distribution is used, pt (E | θt) can be expressed as the following equation.
Figure 2010128674
Here, Σt is a matrix type parameter representing the variance of λ (t), and μ (t) is a vector type parameter representing the average of λ (t). θt represents these parameters collectively.

図3で示したスコア計算処理部204は、分布学習処理部203で学習されたE(t)の分布から、時刻tにおけるシステム全体の異常度スコアS(t)を算出する。異常度スコアは入力データが通常のデータとどれだけ異なっているかを表す量で、この値が大きければ、通常は出現しない異常なデータであることを表す。   The score calculation processing unit 204 shown in FIG. 3 calculates the degree of abnormality score S (t) of the entire system at time t from the distribution of E (t) learned by the distribution learning processing unit 203. The degree of abnormality score is an amount representing how much the input data differs from normal data. If this value is large, it indicates that the data is abnormal data that does not normally appear.

異常度スコアS(t)は、たとえば下式のように計算される。

Figure 2010128674
図3で示した異常検出処理部205は、スコア計算処理部204で算出された異常度スコアを基にしてシステム全体の異常を検出する。異常度スコアの情報を基にシステムの異常を検出する方法としては、たとえば異常度スコアが予め設定された閾値を超えた場合を異常として検出するようにすることができる。また、検出結果の出力は、異常の発生が検出された場合にコンピュータ11が備える表示装置(ディスプレイ)にその旨を表示するようにすることができるし、それ以外にもユーザに異常の発生を知らせることのできる方法であれば任意の出力方法を適用することができる。 The abnormality degree score S (t) is calculated, for example, as in the following equation.
Figure 2010128674
The abnormality detection processing unit 205 illustrated in FIG. 3 detects an abnormality of the entire system based on the abnormality degree score calculated by the score calculation processing unit 204. As a method of detecting an abnormality of the system based on the information of the abnormality degree score, for example, a case where the abnormality degree score exceeds a preset threshold value can be detected as an abnormality. The output of the detection result can be displayed on a display device (display) included in the computer 11 when the occurrence of an abnormality is detected. Any output method can be applied as long as it can be notified.

(第1の実施形態の全体的な動作)
次に、上記の実施形態の全体的な動作について説明する。本実施形態に係る動作は、複数台のコンピュータ11〜1nが相互に接続されてなるコンピュータネットワーク1にあって、それらのコンピュータ11〜1nで発生した異常を検出する方法であって、コンピュータネットワーク1に接続された全てのコンピュータ11〜1nの特徴量取得部115および125が、特徴量を取得し、特徴量取得部115および125が、取得した特徴量をコンピュータネットワークに接続された異常検出装置(コンピュータ11)に転送し、異常検出装置のデータ入力処理部201が、転送された特徴量から行列もしくはテンソルとして入力データを作成し、異常検出装置の不変量計算処理部202が、入力データの中で要素を入れ替えても不変な量である不変量を算出し、異常検出装置の分布学習処理部203が、不変量の確率密度を逐次的に求め、異常検出装置のスコア計算処理部204が、確率密度を用いて不変量の異常度を表す第1の外れ値スコアを算出し、異常検出装置の異常検出処理部205が、第1の外れ値スコアを用いて異常が発生したか否かを検出する。
(Overall operation of the first embodiment)
Next, the overall operation of the above embodiment will be described. The operation according to the present embodiment is a method for detecting an abnormality that has occurred in a computer network 1 in which a plurality of computers 11 to 1n are connected to each other, and the computer network 1 The feature amount acquisition units 115 and 125 of all the computers 11 to 1n connected to the computer acquire the feature amount, and the feature amount acquisition units 115 and 125 detect the acquired feature amount in the abnormality detection device ( The data input processing unit 201 of the abnormality detection device creates input data as a matrix or tensor from the transferred feature quantity, and the invariant calculation processing unit 202 of the abnormality detection device The invariant which is an invariable amount even if the elements are replaced in step 1, and the distribution learning processing unit 2 of the abnormality detection device is calculated. 3 obtains the invariant probability density sequentially, and the score calculation processing unit 204 of the abnormality detection apparatus calculates a first outlier score representing the degree of abnormality of the invariant using the probability density, and the abnormality detection apparatus The abnormality detection processing unit 205 detects whether or not an abnormality has occurred using the first outlier score.

また、ここでいう特徴量は、複数台のコンピュータの相互間の通信トラフィックとすることができる。   Further, the feature value here can be communication traffic between a plurality of computers.

ここで、上記各動作ステップについては、これをコンピュータで実行可能にプログラム化し、これらを前記各ステップを直接実行するコンピュータ11〜1nに実行させるようにしてもよい。
この動作により、本実施形態は以下のような効果を奏する。
Here, about each said operation step, this may be programmed so that execution is possible with a computer, and you may make it carry out these to the computers 11-1n which perform each said step directly.
By this operation, this embodiment has the following effects.

本実施形態では、コンピュータネットワーク1を構成するn台のコンピュータ11〜1nで時刻tに観測された相互間の通信トラフィックを処理の対象としているので、異常度スコアS(t)が高いことは通信トラフィックの偏り方が通常とは異なる状態であるということに対応する。この状態はワームの蔓延や全体的な通信の輻輳の発生等の全体的な異常が発生によって引き起こされるので、異常度スコアを監視することでコンピュータネットワーク全体の異常を検出できる。   In the present embodiment, since the communication traffic observed at the time t by the n computers 11 to 1n constituting the computer network 1 is a processing target, it is indicated that the abnormality score S (t) is high. This corresponds to the fact that the way of traffic bias is different from normal. Since this state is caused by the occurrence of an overall abnormality such as the spread of worms or the occurrence of overall communication congestion, the abnormality of the entire computer network can be detected by monitoring the abnormality score.

要素同士が相関を持つネットワーク等のシステムに対して、特定の要素の性質に依らないシステム全体の挙動の異常を検出することが出来る。その理由は、システム全体を表す特徴量から、要素の入れ替えに関して不変な量を構成し、その量を入力として異常を検出するからである。   For a system such as a network in which elements are correlated with each other, it is possible to detect an abnormality in the behavior of the entire system that does not depend on the properties of specific elements. The reason is that an invariable quantity is formed with respect to element replacement from the feature quantity representing the entire system, and an abnormality is detected using that quantity as an input.

また、異常の検出に際して、誤検出を削減することができる。その理由は、特定の要素の性質によらない異常のみを検出するので、異常と判断される回数(アラーム数)を削減することができるからである。特定の要素の性質によらない異常を検出することで、実際には異常ではないにもかかわらず、特定の要素のみが例外的な挙動を示したというだけで異常と判断される回数を減らすことができ、誤報の削減につながる。   Further, it is possible to reduce false detection when detecting an abnormality. The reason is that only the abnormality that does not depend on the property of the specific element is detected, so that the number of times that the abnormality is determined (the number of alarms) can be reduced. By detecting anomalies that do not depend on the nature of a particular element, it is possible to reduce the number of times that an anomaly is judged to be abnormal just because a particular element showed exceptional behavior, even though it is not actually anomaly. Can lead to a reduction in false alarms.

さらに、時刻と共に変化し、異常な状態を定義することが難しいシステムに対して異常検出を行うことができる。その理由は、要素の入れ替えに対して不変な特徴量の確率分布の学習を行うことで、発生確率の低いものを異常として検出できるからである。確率分布の学習には異常な状態の定義を与える必要はなく、また、確率分布を逐次的に更新することで時刻と共に変化するシステムを扱うことができる。   Furthermore, abnormality detection can be performed on a system that changes with time and it is difficult to define an abnormal state. The reason is that, by learning the probability distribution of the feature quantity that is invariant to the replacement of elements, it is possible to detect a low occurrence probability as an abnormality. It is not necessary to give a definition of an abnormal state to learning a probability distribution, and it is possible to handle a system that changes with time by sequentially updating the probability distribution.

(第2の実施形態)
本発明の第2の実施形態は、ネットワークおよびハードウェアの構成、さらにソフトウェアの大まかな構成は前述の図1〜3と同一である。第2の実施形態が前述の第1の実施形態と異なる点は、分布学習処理部203が不変量の時間遷移に対する確率密度分布を学習する特徴量分布学習機能部301と、学習された確率密度分布から不変量が通常の出現パターンからどれだけ外れているかを示す第2の外れ値スコアを算出する外れ値スコア移動平均機能部302と、第2の外れ値スコアの時間遷移に対する確率密度を学習する移動平均分布学習機能部303とを含み、またスコア計算処理部304が第2の外れ値スコアの時間遷移に対する確率密度から第1の外れ値スコアを算出するという点にある。
(Second Embodiment)
In the second embodiment of the present invention, the network and hardware configurations, and the rough software configuration are the same as those shown in FIGS. The second embodiment differs from the first embodiment described above in that the distribution learning processing unit 203 learns the probability density distribution with respect to the invariant temporal transition, and the learned probability density An outlier score moving average function unit 302 for calculating a second outlier score indicating how far the invariant deviates from the normal appearance pattern from the distribution, and learning the probability density for the time transition of the second outlier score And a moving average distribution learning function unit 303. The score calculation processing unit 304 calculates a first outlier score from the probability density with respect to time transition of the second outlier score.

この構成を備えることにより、本実施形態は、不変量の急激な変化をより的確に検出することが可能となる。
以下、これをより詳細に説明する。
By providing this configuration, the present embodiment can more accurately detect an abrupt change of the invariant.
Hereinafter, this will be described in more detail.

図4は、本発明の第2の実施形態における、図1に示した異常検出部116の構成をより詳しく説明する説明図である。本実施形態では、分布学習処理部203はさらに、不変量の時間遷移に対する確率密度分布を学習する特徴量分布学習機能部301、学習された確率密度分布から不変量E(t)が通常の出現パターンからどの程度外れているかを示す第2の外れ値スコアを算出する外れ値スコア移動平均機能部302、第2の外れ値スコアの時間遷移に対する確率密度を学習する移動平均分布学習機能部303といった各機能部に分かれる。   FIG. 4 is an explanatory diagram for explaining in more detail the configuration of the abnormality detection unit 116 shown in FIG. 1 according to the second embodiment of the present invention. In this embodiment, the distribution learning processing unit 203 further includes a feature amount distribution learning function unit 301 that learns a probability density distribution with respect to an invariant temporal transition, and an invariant E (t) that normally appears from the learned probability density distribution. An outlier score moving average function unit 302 that calculates a second outlier score indicating how far the pattern deviates, a moving average distribution learning function unit 303 that learns the probability density for the time transition of the second outlier score, etc. Divided into functional parts.

第2の実施形態が前述の第1の実施形態と異なる点は、分布学習処理部203の動作である。第1の実施形態では、不変量E(t)がそれまで学習された通常のパターンからどれだけ外れているかの度合いで異常度スコアを算出した。以下に説明する第2の実施形態では、不変量E(t)がどれだけ急激に変化したかで異常度を定義する。   The difference of the second embodiment from the first embodiment is the operation of the distribution learning processing unit 203. In the first embodiment, the degree of abnormality score is calculated based on how far the invariant E (t) deviates from the normal pattern learned so far. In the second embodiment described below, the degree of abnormality is defined by how rapidly the invariant E (t) changes.

また、スコア計算処理部304の動作も、後述するように第1の実施形態におけるスコア計算処理部204と多少異なるので、ここでは別の参照番号を付している。それら以外の各処理部は、図3で示した第1の実施形態と同一の構成および動作を行うので、名称および参照番号は全て同一とする。   Also, the operation of the score calculation processing unit 304 is slightly different from the score calculation processing unit 204 in the first embodiment as will be described later, and therefore a different reference number is given here. Since the other processing units perform the same configuration and operation as those of the first embodiment shown in FIG. 3, the names and reference numbers are all the same.

特徴量分布学習機能部301では、E(t)の時間遷移の確率密度分布を学習する。以後、E(t)の時間遷移の確率密度分布は下式のように表記する。

Figure 2010128674
The feature amount distribution learning function unit 301 learns the probability density distribution of the time transition of E (t). Hereinafter, the probability density distribution of the time transition of E (t) is expressed as the following equation.
Figure 2010128674

図4の外れ値スコア移動平均機能部302は、特徴量分布学習機能部301で学習された確率密度分布からE(t)が通常の出現パターンからどれだけ外れているかを表す(第2の)外れ値スコアO(t)を計算する。外れ値スコアO(t)は、値が大きいほど通常の出現パターンから外れていることを表す。外れ値スコアO(t)は、下式のように計算される。

Figure 2010128674
The outlier score moving average function unit 302 in FIG. 4 represents how much E (t) deviates from the normal appearance pattern from the probability density distribution learned by the feature amount distribution learning function unit 301 (second). An outlier score O (t) is calculated. The outlier score O (t) indicates that the larger the value, the more out of the normal appearance pattern. The outlier score O (t) is calculated as follows:
Figure 2010128674

外れ値スコア移動平均機能部302はさらに、外れ値スコアO(t)の移動平均y(t)を、下式で計算する。ωはウィンドウの大きさを表す。このy(t)は外れ値スコアの時間的な密集度を表す量である。

Figure 2010128674
The outlier score moving average function unit 302 further calculates the moving average y (t) of the outlier score O (t) by the following equation. ω represents the size of the window. This y (t) is a quantity representing the temporal density of the outlier score.
Figure 2010128674

図4の移動平均分布学習機能部303では、下式で表されるy(t)の時間遷移の確率密度分布を学習する。

Figure 2010128674
4 learns the probability density distribution of the time transition of y (t) expressed by the following equation.
Figure 2010128674

スコア算出処理部304では、数13で示した移動平均の分布を用いて求めた移動平均y(t)の(第1の)外れ値スコアS’(t)を下式で算出し、これをコンピュータネットワーク1全体の異常度とする。

Figure 2010128674
The score calculation processing unit 304 calculates the (first) outlier score S ′ (t) of the moving average y (t) obtained using the moving average distribution shown in Equation 13 by the following equation. The degree of abnormality of the entire computer network 1 is assumed.
Figure 2010128674

以上で説明した以外の各処理部は、図3で示した第1の実施形態と同一の構成および動作を行う。   Each processing unit other than those described above performs the same configuration and operation as in the first embodiment shown in FIG.

このS’(t)はバースト的な急激な変化が起こっている場合に高い値を取るという性質がある。従って、このS’(t)を外れ値スコアとして用いることは、E(t)の急激な変化をシステム全体の異常と見做すことに相当する。   This S '(t) has a property of taking a high value when a bursty sudden change occurs. Therefore, using this S ′ (t) as an outlier score is equivalent to considering a sudden change in E (t) as an abnormality of the entire system.

(第2の実施形態の全体的な動作)
次に、上記の実施形態の全体的な動作について説明する。本実施形態に係る動作は、第1の実施形態で説明した動作で、分布学習処理部203が不変量の確率密度を逐次的に求める工程が、不変量の時間遷移に対する確率密度分布を学習する工程と、学習された確率密度分布から不変量が通常の出現パターンからどの程度外れているかを示す第2の外れ値スコアO(t)を算出する工程と、第2の外れ値スコアO(t)の時間遷移に対する確率密度を学習する工程とを含み、スコア計算処理部304が第2の外れ値スコアの時間遷移に対する確率密度から第1の外れ値スコアS’(t)を算出する。
(Overall operation of the second embodiment)
Next, the overall operation of the above embodiment will be described. The operation according to the present embodiment is the operation described in the first embodiment, and the step of the distribution learning processing unit 203 sequentially obtaining the invariant probability density learns the probability density distribution with respect to the invariant time transition. A step of calculating a second outlier score O (t) indicating how far the invariant deviates from the normal appearance pattern from the learned probability density distribution, and a second outlier score O (t The score calculation processing unit 304 calculates a first outlier score S ′ (t) from the probability density for the time transition of the second outlier score.

ここで、上記各動作ステップについては、これをコンピュータで実行可能にプログラム化し、これらを前記各ステップを直接実行するコンピュータ11〜1nに実行させるようにしてもよい。
この動作により、本実施形態は以下のような効果を奏する。
Here, about each said operation step, this may be programmed so that execution is possible with a computer, and you may make it carry out these to the computers 11-1n which perform each said step directly.
By this operation, this embodiment has the following effects.

第2の実施形態は、第1の実施形態の特徴に加えて、第1の実施形態よりもE(t)の急激な変化をより的確に検出できるという効果を得ることができる。   In addition to the features of the first embodiment, the second embodiment can obtain an effect that a sudden change in E (t) can be detected more accurately than in the first embodiment.

(実施形態の拡張)
上記の第1および第2の実施形態では、コンピュータネットワークで相互に接続されている各々のコンピュータ間の通信トラフィックを特徴量として、ワームおよびウイルスなどの発生および蔓延に起因する異常の検出を行うものとした。しかしながら、本発明の適用可能な範囲はそれだけではない。多数のノードが相互に接続された系で、それらのノードの相互間の関係を示す量であれば、ここでいう「(ネットワーク全体の)特徴量」と捉えることができる。
(Extended embodiment)
In the first and second embodiments described above, detection of anomalies caused by the occurrence and spread of worms and viruses, etc., using communication traffic between computers connected to each other via a computer network as a feature amount It was. However, the applicable range of the present invention is not limited thereto. In a system in which a large number of nodes are connected to each other, an amount indicating the relationship between these nodes can be regarded as the “feature amount (of the entire network)” here.

たとえば、機械の故障診断の例を考えると、機械の中の1つのパーツ(自動車ならエンジン、トランスミッションなど)を1つのノード、該パーツの出力間の相関の強さ(自動車ならエンジンの出力と他のパーツの電圧との間の相関係数)を「特徴量」とみなすことができる。ここに本発明の手法を適用すれば、これらのパーツ間の挙動が通常と異なり始めた場合に異常と判断するので、該機械の故障診断に利用することができる。   For example, consider an example of a machine fault diagnosis. One part of a machine (engine, transmission, etc. for a car) is one node, and the strength of the correlation between the outputs of that part (engine output and other for a car) (Correlation coefficient between the voltages of the parts) can be regarded as a “feature amount”. If the method of the present invention is applied here, it is determined that there is an abnormality when the behavior between these parts begins to be different from the normal one, so that it can be used for failure diagnosis of the machine.

また、国際経済の状態の分析の例を考えると、1つの国を1つのノード、各国の経済指標(株価指数、為替レートなど)の相関の強さを「特徴量」とみなすことができる。ここに本発明の手法を適用すれば、株価指数間の関係が全体的に通常と異なり始めた場合に異常と判断するので、経済状態の異常検出に利用することができる。   Considering an example of the analysis of the state of the international economy, one country can be regarded as one node, and the strength of the correlation between the economic indicators (stock price index, exchange rate, etc.) of each country can be regarded as a “feature”. If the method of the present invention is applied here, it is determined that an abnormality occurs when the relationship between the stock price indexes starts to be different from the normal one, so that it can be used to detect an abnormality in the economic state.

これまで本発明について図面に示した特定の実施形態をもって説明してきたが、本発明は図面に示した実施形態に限定されるものではなく、本発明の効果を奏する限り、これまで知られたいかなる構成であっても採用することができる。   The present invention has been described with reference to the specific embodiments shown in the drawings. However, the present invention is not limited to the embodiments shown in the drawings, and any known hitherto provided that the effects of the present invention are achieved. Even if it is a structure, it is employable.

コンピュータネットワークにおけるワーム、ウイルス、マルウェアなどのような不正プログラムに起因する通信トラフィックの異常の検出に適用できる。これ以外にも、前述のように多数のノードが相互に接続された系で、それらのノードの相互間の関係を示す量を特徴量として捉えることのできる系全般に適用することができる。   It can be applied to the detection of communication traffic anomalies caused by malicious programs such as worms, viruses, and malware in computer networks. In addition to this, as described above, the present invention can be applied to a system in which a large number of nodes are connected to each other, and an amount indicating the relationship between the nodes can be regarded as a feature amount.

本発明の第1の実施形態に係るコンピュータ内部の構成を詳細に示す説明図である。It is explanatory drawing which shows the structure inside the computer concerning the 1st Embodiment of this invention in detail. 本発明の第1の実施形態に係るコンピュータネットワークについて示す説明図である。It is explanatory drawing shown about the computer network which concerns on the 1st Embodiment of this invention. 図1に示した異常検出部の構成をより詳しく説明する説明図である。It is explanatory drawing explaining in more detail the structure of the abnormality detection part shown in FIG. 本発明の第2の実施形態における、図1に示した異常検出部の構成をより詳しく説明する説明図である。It is explanatory drawing explaining in detail the structure of the abnormality detection part shown in FIG. 1 in the 2nd Embodiment of this invention.

符号の説明Explanation of symbols

1 コンピュータネットワーク
11、12 コンピュータ
111、121 CPU
112、122 RAM
113、123 HDD
114、124 ネットワークアダプタ
115、125 トラフィック取得部
116 異常検出部
201 データ入力処理部
202 不変量計算処理部
203 分布学習処理部
204、304 スコア計算処理部
205 異常検出処理部
301 特徴量分布学習機能部
302 外れ値スコア移動平均機能部
303 移動平均分布学習機能部
1 Computer network 11, 12 Computer 111, 121 CPU
112, 122 RAM
113, 123 HDD
114, 124 Network adapter 115, 125 Traffic acquisition unit 116 Anomaly detection unit 201 Data input processing unit 202 Invariant calculation processing unit 203 Distribution learning processing unit 204, 304 Score calculation processing unit 205 Anomaly detection processing unit 301 Feature quantity distribution learning function unit 302 Outlier Score Moving Average Function Unit 303 Moving Average Distribution Learning Function Unit

Claims (13)

複数台のコンピュータが相互に接続されてなるコンピュータネットワークであって、
前記複数台のコンピュータのうち少なくとも1台が、前記ネットワーク全体の通信トラフィック等の特徴量を検出する第1の特徴量取得部と、前記特徴量から異常検出に係る計算を行う異常検出部とを有する異常検出装置であり、
前記複数台のコンピュータのうち前記異常検出装置でない他の全てのものが、前記特徴量を検出して前記異常検出部に転送する第2の特徴量取得部を有し、
前記異常検出装置の前記異常検出部が、前記第1および第2の特徴量取得部で取得された特徴量を行列もしくはテンソルとして入力データを作成するデータ入力処理部と、前記入力データの中で要素を入れ替えても不変な量である不変量を算出する不変量計算処理部と、前記不変量に基づいて異常が発生したか否かを検出する異常検出手段とを有することを特徴とするコンピュータネットワーク。
A computer network in which a plurality of computers are connected to each other,
At least one of the plurality of computers includes a first feature amount acquisition unit that detects a feature amount such as communication traffic of the entire network, and an abnormality detection unit that performs calculation related to abnormality detection from the feature amount. An abnormality detection device having
All other computers that are not the abnormality detection device among the plurality of computers have a second feature amount acquisition unit that detects the feature amount and transfers it to the abnormality detection unit,
The anomaly detection unit of the anomaly detection device includes a data input processing unit that creates input data using the feature quantities acquired by the first and second feature quantity acquisition units as a matrix or a tensor, and among the input data A computer comprising: an invariant calculation processing unit that calculates an invariant that is an invariant even when elements are replaced; and an abnormality detection unit that detects whether an abnormality has occurred based on the invariant. network.
前記異常検出手段が、前記不変量の確率密度を逐次的に求める分布学習処理部と、前記確率密度を用いて前記不変量の異常度を表す第1の外れ値スコアを算出するスコア計算処理部と、前記第1の外れ値スコアを用いて異常が発生したか否かを検出する異常検出処理部とを有することを特徴とする、請求項1に記載のコンピュータネットワーク。   A distribution learning processing unit that sequentially obtains the invariant probability density; and a score calculation processing unit that calculates a first outlier score representing the invariant abnormality degree using the probability density. The computer network according to claim 1, further comprising: an abnormality detection processing unit that detects whether an abnormality has occurred using the first outlier score. 前記分布学習処理部が、前記不変量の時間遷移に対する確率密度分布を学習する特徴量分布学習機能部と、学習された前記確率密度分布から前記不変量が通常の出現パターンからどの程度外れているかを示す第2の外れ値スコアを算出する外れ値スコア移動平均機能部と、前記第2の外れ値スコアの時間遷移に対する確率密度を学習する移動平均分布学習機能部とを含み、
前記スコア計算処理部が前記第2の外れ値スコアの時間遷移に対する確率密度から前記第1の外れ値スコアを算出することを特徴とする、請求項2に記載のコンピュータネットワーク。
The distribution learning processing unit learns the probability density distribution with respect to the time transition of the invariant, and how much the invariant deviates from the normal appearance pattern from the learned probability density distribution. An outlier score moving average function unit that calculates a second outlier score indicating a moving average distribution learning function unit that learns a probability density for a time transition of the second outlier score,
The computer network according to claim 2, wherein the score calculation processing unit calculates the first outlier score from a probability density with respect to time transition of the second outlier score.
前記第1および第2の特徴量取得部が、該複数台のコンピュータの相互間の通信トラフィックを前記特徴量として取得して前記異常検出部に転送するトラフィック取得部であることを特徴とする、請求項1ないし請求項3のうちいずれか1項に記載のコンピュータネットワーク。   The first and second feature amount acquisition units are traffic acquisition units that acquire communication traffic between the plurality of computers as the feature amount and transfer it to the abnormality detection unit, The computer network according to any one of claims 1 to 3. コンピュータネットワークに接続されたコンピュータからなる異常検出装置であって、
前記コンピュータネットワークに接続された他のコンピュータで取得された通信トラフィック等の特徴量を行列もしくはテンソルとして入力データを作成するデータ入力処理部と、
前記入力データの中で要素を入れ替えても不変な量である不変量を算出する不変量計算処理部と、
前記不変量に基づいて異常が発生したか否かを検出する異常検出手段と
を有することを特徴とする異常検出装置。
An anomaly detection device comprising a computer connected to a computer network,
A data input processing unit for creating input data as a matrix or a tensor with feature quantities such as communication traffic acquired by other computers connected to the computer network; and
An invariant calculation processing unit that calculates an invariant that is an invariant even if elements are replaced in the input data;
An abnormality detection device comprising: an abnormality detection means for detecting whether an abnormality has occurred based on the invariant.
前記異常検出手段が、
前記不変量の確率密度を逐次的に求める分布学習処理部と、
前記確率密度を用いて前記不変量の異常度を表す第1の外れ値スコアを算出するスコア計算処理部と、
前記第1の外れ値スコアを用いて異常が発生したか否かを検出する異常検出処理部と
を有することを特徴とする、請求項5に記載の異常検出装置。
The abnormality detection means is
A distribution learning processing unit for sequentially obtaining the invariant probability density;
A score calculation processing unit that calculates a first outlier score representing the degree of abnormality of the invariant using the probability density;
The abnormality detection device according to claim 5, further comprising: an abnormality detection processing unit that detects whether an abnormality has occurred using the first outlier score.
前記分布学習処理部が、前記不変量の時間遷移に対する確率密度分布を学習する特徴量分布学習機能部と、学習された前記確率密度分布から前記不変量が通常の出現パターンからどの程度外れているかを示す第2の外れ値スコアを算出する外れ値スコア移動平均機能部と、前記第2の外れ値スコアの時間遷移に対する確率密度を学習する移動平均分布学習機能部とを含み、
前記スコア計算処理部が前記第2の外れ値スコアの時間遷移に対する確率密度から前記第1の外れ値スコアを算出することを特徴とする、請求項6に記載の異常検出装置。
The distribution learning processing unit learns the probability density distribution with respect to the time transition of the invariant, and how much the invariant deviates from the normal appearance pattern from the learned probability density distribution. An outlier score moving average function unit that calculates a second outlier score indicating a moving average distribution learning function unit that learns a probability density for a time transition of the second outlier score,
The abnormality detection apparatus according to claim 6, wherein the score calculation processing unit calculates the first outlier score from a probability density with respect to time transition of the second outlier score.
前記特徴量が、前記コンピュータネットワークにおける前記複数台のコンピュータの相互間の通信トラフィックであることを特徴とする、請求項5ないし請求項7のうちいずれか1項に記載の異常検出装置。   The abnormality detection device according to claim 5, wherein the feature amount is communication traffic between the plurality of computers in the computer network. 複数台のコンピュータが相互に接続されてなるコンピュータネットワークにあって、前記コンピュータネットワークに接続されたコンピュータで発生した異常を検出する方法であって、
前記コンピュータネットワークに接続されたコンピュータの特徴量取得部が、通信トラフィック等の特徴量を取得し、
前記特徴量取得部が、取得した前記特徴量を前記コンピュータネットワークに接続された異常検出装置に転送し、
前記異常検出装置のデータ入力処理部が、転送された前記特徴量から行列もしくはテンソルとして入力データを作成し、
前記異常検出装置の不変量計算処理部が、前記入力データの中で要素を入れ替えても不変な量である不変量を算出し、
前記異常検出装置の異常検出手段が、前記不変量に基づいて異常が発生したか否かを検出する
ことを特徴とする異常検出方法。
In a computer network in which a plurality of computers are connected to each other, a method for detecting an abnormality that has occurred in a computer connected to the computer network,
A feature amount acquisition unit of a computer connected to the computer network acquires a feature amount such as communication traffic,
The feature amount acquisition unit transfers the acquired feature amount to an abnormality detection device connected to the computer network,
The data input processing unit of the abnormality detection device creates input data as a matrix or tensor from the transferred feature quantity,
The invariant calculation processing unit of the abnormality detection device calculates an invariant that is an invariant even if elements are replaced in the input data,
An abnormality detection method, wherein the abnormality detection means of the abnormality detection device detects whether an abnormality has occurred based on the invariant.
前記異常検出手段が前記不変量に基づいて異常が発生したか否かを検出する手順が、前記異常検出装置の分布学習処理部が、前記不変量の確率密度を逐次的に求める手順と、前記異常検出装置のスコア計算処理部が、前記確率密度を用いて前記不変量の異常度を表す第1の外れ値スコアを算出する手順とを設け、
これによって前記異常検出装置の異常検出処理部が、前記第1の外れ値スコアを用いて異常が発生したか否かを検出することを特徴とする、請求項9に記載の異常検出方法。
The procedure for detecting whether or not an abnormality has occurred based on the invariant by the anomaly detection means is a procedure for the distribution learning processing unit of the anomaly detection device to sequentially obtain the probability density of the invariant, The score calculation processing unit of the abnormality detection device provides a procedure for calculating a first outlier score representing the degree of abnormality of the invariant using the probability density,
The abnormality detection method according to claim 9, wherein the abnormality detection processing unit of the abnormality detection device detects whether or not an abnormality has occurred using the first outlier score.
前記分布学習処理部が前記不変量の確率密度を逐次的に求める手順が、前記不変量の時間遷移に対する確率密度分布を学習する手順と、学習された前記確率密度分布から前記不変量が通常の出現パターンからどの程度外れているかを示す第2の外れ値スコアを算出する工程と、前記第2の外れ値スコアの時間遷移に対する確率密度を学習する手順とを設け、
これによって前記スコア計算処理部が、前記第2の外れ値スコアの時間遷移に対する確率密度から前記第1の外れ値スコアを算出することを特徴とする、請求項10に記載の異常検出方法。
The distribution learning processing unit sequentially obtains the invariant probability density, the procedure for learning the probability density distribution with respect to the time transition of the invariant, and the invariant from the learned probability density distribution. Providing a step of calculating a second outlier score indicating how far the appearance pattern deviates, and a procedure for learning a probability density for a time transition of the second outlier score;
11. The abnormality detection method according to claim 10, wherein the score calculation processing unit calculates the first outlier score from the probability density with respect to time transition of the second outlier score.
前記特徴量が、前記複数台のコンピュータの相互間の通信トラフィックであることを特徴とする、請求項9ないし請求項11のうちいずれか1項に記載の異常検出方法。   The abnormality detection method according to claim 9, wherein the feature amount is communication traffic between the plurality of computers. コンピュータネットワークに接続された異常検出装置が備えるコンピュータに、
前記コンピュータネットワークに接続されたコンピュータで取得された通信トラフィック等の特徴量から行列もしくはテンソルとして入力データを作成する手順と、
前記入力データの中で要素を入れ替えても不変な量である不変量を算出する手順と、
前記不変量に基づいて異常が発生したか否かを検出する手順と
を実行させることを特徴とする異常検出プログラム。
In the computer provided in the abnormality detection device connected to the computer network,
A procedure for creating input data as a matrix or tensor from features such as communication traffic acquired by a computer connected to the computer network;
A procedure for calculating an invariant which is an invariant even if elements are replaced in the input data;
And a procedure for detecting whether an abnormality has occurred based on the invariant.
JP2008301045A 2008-11-26 2008-11-26 Computer network, and apparatus, method, and program for detecting abnormality Withdrawn JP2010128674A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2008301045A JP2010128674A (en) 2008-11-26 2008-11-26 Computer network, and apparatus, method, and program for detecting abnormality

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008301045A JP2010128674A (en) 2008-11-26 2008-11-26 Computer network, and apparatus, method, and program for detecting abnormality

Publications (1)

Publication Number Publication Date
JP2010128674A true JP2010128674A (en) 2010-06-10

Family

ID=42329036

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008301045A Withdrawn JP2010128674A (en) 2008-11-26 2008-11-26 Computer network, and apparatus, method, and program for detecting abnormality

Country Status (1)

Country Link
JP (1) JP2010128674A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013014987A1 (en) * 2011-07-25 2013-01-31 インターナショナル・ビジネス・マシーンズ・コーポレーション Information identification method, program and system
JP2016181265A (en) * 2012-05-01 2016-10-13 ターセーラ, インコーポレイテッド System and method for providing mobile security based on dynamic proof
JP2016189062A (en) * 2015-03-30 2016-11-04 有限責任監査法人トーマツ Abnormality detection device, abnormality detection method and network abnormality detection system
JP7079048B1 (en) * 2022-01-04 2022-06-01 広東工業大学 Cluster period coordinated control method and equipment

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013014987A1 (en) * 2011-07-25 2013-01-31 インターナショナル・ビジネス・マシーンズ・コーポレーション Information identification method, program and system
GB2507217A (en) * 2011-07-25 2014-04-23 Ibm Information identification method, program and system
JP5568183B2 (en) * 2011-07-25 2014-08-06 インターナショナル・ビジネス・マシーンズ・コーポレーション Information identification method, program and system
US9471882B2 (en) 2011-07-25 2016-10-18 International Business Machines Corporation Information identification method, program product, and system using relative frequency
JP2016181265A (en) * 2012-05-01 2016-10-13 ターセーラ, インコーポレイテッド System and method for providing mobile security based on dynamic proof
JP2016189062A (en) * 2015-03-30 2016-11-04 有限責任監査法人トーマツ Abnormality detection device, abnormality detection method and network abnormality detection system
JP7079048B1 (en) * 2022-01-04 2022-06-01 広東工業大学 Cluster period coordinated control method and equipment

Similar Documents

Publication Publication Date Title
Ma et al. A review on dimension reduction
US10423647B2 (en) Descriptive datacenter state comparison
EP2924579B1 (en) Event correlation
US20180174062A1 (en) Root cause analysis for sequences of datacenter states
Li et al. A diagnostic procedure for high-dimensional data streams via missed discovery rate control
Mohammadpour et al. A mean convolutional layer for intrusion detection system
CN115099684B (en) Enterprise safety production management system and management method thereof
CN110110160B (en) Method and device for determining data exception
US10885593B2 (en) Hybrid classification system
US10417079B2 (en) Fault tolerant root cause analysis system
CN112380073B (en) Fault position detection method and device and readable storage medium
CN110912908A (en) Network protocol anomaly detection method, device, computer equipment and storage medium
CN116759053A (en) Medical system prevention and control methods and systems based on the Internet of Things system
CN114401205B (en) Unlabeled multi-source network traffic data drift detection method and device
JP2010128674A (en) Computer network, and apparatus, method, and program for detecting abnormality
WO2016084326A1 (en) Information processing system, information processing method, and recording medium
US11347864B2 (en) Ace: assurance, composed and explained
Li et al. Lightweight approaches to DNN regression error reduction: An uncertainty alignment perspective
US12348956B1 (en) Method for protecting data in a wireless body area network (WBAN) system
Pei et al. Application of multivariate time-series model for high performance computing (HPC) fault prediction
JP2010128673A (en) Computer network, device, and method of detecting and specifying abnormality, and program thereof
CN112799862B (en) Reliability modeling and evaluating method for CPU anti-SEU effect facing radiation environment
Huong et al. Anomaly detection enables cybersecurity with machine learning techniques
CN110546616A (en) probability metric for random hardware faults
CN118400182A (en) CPS system remote state estimation method, CPS system remote state estimation device and readable storage medium

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20120207