JP2012018450A - ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム - Google Patents
ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム Download PDFInfo
- Publication number
- JP2012018450A JP2012018450A JP2010153765A JP2010153765A JP2012018450A JP 2012018450 A JP2012018450 A JP 2012018450A JP 2010153765 A JP2010153765 A JP 2010153765A JP 2010153765 A JP2010153765 A JP 2010153765A JP 2012018450 A JP2012018450 A JP 2012018450A
- Authority
- JP
- Japan
- Prior art keywords
- neural network
- neural networks
- learning
- neural
- network system
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Measuring And Recording Apparatus For Diagnosis (AREA)
Abstract
【課題】
病歴あるいは健診の情報から疾患を推定し状況の変化を予測する等の推定処理を行うニューラルネットワークを用いたエキスパートシステムにおいて、推定結果と共に推定の確度を出力することが可能なニューラルネットワークシステムを提供する。
【解決手段】
入力層のノード数、中間層の数、中間層を構成するノードの数、各重み係数の初期値、学習の方法(ノード間の伝搬関数)等の構成要素が異なるニューラルネットワークを複数生成し、それらに同じ学習処理を行う。上記の複数のニューラルネットワークにより未知のパターンの推論を行い、推論のバラツキから判定結果の確実さを数値で出力する
【選択図】 図2
病歴あるいは健診の情報から疾患を推定し状況の変化を予測する等の推定処理を行うニューラルネットワークを用いたエキスパートシステムにおいて、推定結果と共に推定の確度を出力することが可能なニューラルネットワークシステムを提供する。
【解決手段】
入力層のノード数、中間層の数、中間層を構成するノードの数、各重み係数の初期値、学習の方法(ノード間の伝搬関数)等の構成要素が異なるニューラルネットワークを複数生成し、それらに同じ学習処理を行う。上記の複数のニューラルネットワークにより未知のパターンの推論を行い、推論のバラツキから判定結果の確実さを数値で出力する
【選択図】 図2
Description
本発明は、複数のニューラルネットワークからなるニューラルネットワークシステムに関するものであり、例えば病歴情報、健診情報から疾患を推定し状況の変化を予測するニューラルネットワークを用いたニューラルネットワークシステムに関するものであり、ニューラルネットワークシステムとその構築方法及び制御プログラムを提供するものである。
人の疾患やプラントの故障等の対応において、外に現れた現象から原因を推定し、今後の推移を予測する手段としてニューラルネットワークの技術が利用されている。ニューラルネットワークは複数のニューロン回路により構成される。ニューロン回路は図7(a)に例示されるように、多入力(X1,X2,・・・・・、Xk)と1出力(y)の回路である。多入力(X1、X2、・・・・・、Xk)の各々には重み係数113(W 1,W 2,・W k)が対応づけられており、重み演算部112により、入力(Xi)と重み係数(W i)の積が求められる。各演算部112の演算結果は加算回路114により加算され、シグモイド関数、ヘビサイド関数等の閾値手段115により正規化され、出力117(y)となる。
図7(b)はニューラルネットワークの一例であり、図7(a)に示されるニューロン回路を複数組み合わせて構成されている。ニューラルネットワークは、診断データ等の測定データの組[X1、X2、・・・・・、Xp]151が入力される入力層152と、疾患名等に対応する1つ以上の出力155を出力する出力層154と、入力層152と出力層154の間に位置する少なくとも1つの中間層153から構成されている。
図7(b)はニューラルネットワークの一例であり、図7(a)に示されるニューロン回路を複数組み合わせて構成されている。ニューラルネットワークは、診断データ等の測定データの組[X1、X2、・・・・・、Xp]151が入力される入力層152と、疾患名等に対応する1つ以上の出力155を出力する出力層154と、入力層152と出力層154の間に位置する少なくとも1つの中間層153から構成されている。
入力層152のi番目のノード(i)は入力(Xi)を中間層153のノードに分配する。中間層153と出力層154を構成するノードは図7(a)に示されるニューロン回路であり、前段のノードからの信号を前述の動作に従って処理し後段のノードに伝達、あるいは出力端子から出力する。
ニューラルネットワークで診断を行うには、例えば各症状あるいは健診の項目(発熱、咳、頭痛、血圧等)について、それらの項目に対応したデータ列を入力パターン[X1、X2、・・・・・、Xp]として、入力層152に入力する。また、出力層154の各ノードには推定すべき原因(病名等)を割り当てる。例えば出力1には「風邪」、出力2には「食中毒」、等を割り当てる。この場合、「風邪」の症状を表す入力パターンを入力部151から入力した時、「風邪」が割り当てられている第1のノードのみから「1」を出力し、他の原因(病名)が割り当てられているノードからは「0」を出力するように、ニューラルネットワークを学習する。
ニューラルネットワークで診断を行うには、例えば各症状あるいは健診の項目(発熱、咳、頭痛、血圧等)について、それらの項目に対応したデータ列を入力パターン[X1、X2、・・・・・、Xp]として、入力層152に入力する。また、出力層154の各ノードには推定すべき原因(病名等)を割り当てる。例えば出力1には「風邪」、出力2には「食中毒」、等を割り当てる。この場合、「風邪」の症状を表す入力パターンを入力部151から入力した時、「風邪」が割り当てられている第1のノードのみから「1」を出力し、他の原因(病名)が割り当てられているノードからは「0」を出力するように、ニューラルネットワークを学習する。
図8はニューラルネットワークの学習の概要を示す図である。同図では出力層のノードは1つのみであり、例えば、入力パターンが「風邪」と認識した時はYESを意味する「1」を、「風邪」と認識しなかった時はNOを意味する「0」を出力するように学習する。「風邪」と認識さる症状等のパターンと、「風邪」と認識させない症状等のパターンを学習パターン161として多数用意する。また、各学習パターンに正解の出力、即ち「風邪」又は「風邪ではない」を表す出力「AZ(「1」又は「0」)」を正解データ162として付加する。学習を開始する前のニューロン回路の各重み係数は所定の初期値、あるいはランダムな値に設定される。学習パターン161の因子[A1]をニューラルネットワークの入力部X1に、因子[A2]を入力部X2と、1つの学習パターン161を構成する各因子をニューラルネットワークの対応する入力部に入力する。入力された学習パターン161の各要素は中間層152と出力層154のニューロン回路により順次演算され、出力端155に出力信号[Z]を出力する。
比較回路163は出力端155に出力された[Z]と学習パターン161に付加されている正解データ[AZ]を比較する。重み変更手段164は出力[Z]と正解データ[AZ]が一致するように、予め定められた方法に従って各ニューロン回路の重み係数の値を変更する。準備した各学習パターンに対して上記の学習動作を行い、全ての学習パターンに対して正しい値を出力する重み係数を決定して学習を終了する。学習が終了したニューラルネットワークに未知の症状のパターンが入力されると、当該症状のパターンの各因子の値を各ニューロン回路の重み係数に従って演算し、「風邪」に該当するか否かを「YES」または「NO」の2値データとして出力層154から出力する。ニューラルネットワークとその学習に関する公知文献には以下のものが存在する。
図7及び図8に示される従来のニューラルネットワーク、あるいは前記の先行技術文献等に記載されるニューラルネットワークは、入力された測定値等の入力パターンが特定の事象に該当するか否かを示すデータを出力するものである。例えば、入力された健診データから数年後に糖尿病を発症するか否かを予測するように学習されたるニューラルネットワークは、判定対象の健診データに対して「糖尿病になる」「糖尿病にならない」の予測結果を出力する。
しかし、特定の疾患が発症する危険度は連続的に変化すると考えられる。また、疾患の予防策を作成する場合、現状のままでは発症する危険性は非常に大きいのか、あるいは危険性は小さいのか等、危険性の度合いを考慮して作成される。しかし、前述したようにニューラルネットワークは「発症する」「発症しない」の2値を出力するのみであり、診断あるいは対策の作成には限定的な意義を持つのみであった。
本発明は、例えば糖尿病の発症を予測する場合、「糖尿病になる可能性は70パーセント」「糖尿病になる可能性は30パーセント」等、発症の可能性を数値により提示することが可能なニューラルネットワークを提供するものである。
しかし、特定の疾患が発症する危険度は連続的に変化すると考えられる。また、疾患の予防策を作成する場合、現状のままでは発症する危険性は非常に大きいのか、あるいは危険性は小さいのか等、危険性の度合いを考慮して作成される。しかし、前述したようにニューラルネットワークは「発症する」「発症しない」の2値を出力するのみであり、診断あるいは対策の作成には限定的な意義を持つのみであった。
本発明は、例えば糖尿病の発症を予測する場合、「糖尿病になる可能性は70パーセント」「糖尿病になる可能性は30パーセント」等、発症の可能性を数値により提示することが可能なニューラルネットワークを提供するものである。
ニューラルネットワークの構成は、入力層のノード数、中間層の数、中間層を構成するノードの数、各重み係数の初期値、学習の方法(ノード間の伝搬関数)等の要素により決まり、構成要素の差異により多様な構成のニューラルネットワークを生成することが可能である。構成要素が異なるニューラルネットワークであっても、それらに同一の学習を行うことにより、多くの場合、未知のパターンに対して同一の判定結果を出力するニューラルネットワークとすることが可能である。しかし、未知のパターンが「YES」と判定されるパターン領域と「NO」と判定されるパターン領域の境界近傍に位置すると、構成要素の異なるニューラルネットワークが異なる判定結果を出力する場合がある。本発明はニューラルネットワークの上記特性を利用することにより、判定結果の確実さを数値で出力することを可能とするものである。
本発明は、同一の学習パターンにより学習した構成要素が異なる複数のニューラルネットワークを用意し、この複数のニューラルネットワークに判定すべきパターンを認識させ、判定結果の「YES」と「NO」の割合により判定結果の確実さを数値で出力する構成である。本発明を1つの疾患の判定に用いた場合、「当該疾患の可能性は70パーセント」等の出力が可能となる。また、出力層のノードを複数とし、各ノードに異なる疾患を対応づけて学習させた場合、各疾患の可能性を数値化し、可能性の高い順に整列して出力する等の構成が可能となる。
図1は本発明に係るニューラルネットワークシステムを構成するニューラルネットワークの概要を示す図である。本発明に係るニューラルネットワークの中間層は1層に限られるものではないが、説明の簡素化のため以下では1層で説明する。図1に示されるニューラルネットワークは、1つの入力層152と、1つの中間層153と、1つの出力層154からなっている。p個の因子からなるパターン[X1、X2、・・、Xi、・・、Xp]の各項が入力端151から入力層の各ノードに入力される。入力層152の各ノードは入力データを中間層153の各ノードに分配する。入力層152の各ノードと中間層153の各ノード)を結ぶ情報伝達路には重み演算部が存在する。例えば、入力層152のノード(i)と中間層153のノード(j)の間には重み演算部(Wij)が設けられており、入力層152のノード(i)からのデータ「Xi」に重み演算部(Wij)が有する重み係数「W ij」を乗じてノード(j)に伝達する。
中力層153のノード(j)は重み演算部(W1j)、・・、(Wpj)から伝達された情報を加算し、所定の方法に従って正規化した後、出力層154のノード(z)に伝達する。中力層153のノード(j)と出力層154のノード(z)を結ぶ情報伝達路には重み演算部(Wjz)が設けられており、中力層153のノード(j)からのデータに重み演算部(Wjz)が有する重み係数「W jz」を乗じて出力層154のノード(z)に伝達する。ノード(z)は、重み演算部(W1z)、・・、(Wmz)から伝達された情報を加算し、所定の方法に従って正規化した後、認識結果「Z」として出力する。
学習段階では、認識結果「Z」はフィードバック手段162に入力されて図8に示される正解「AZ」と比較され、各重み演算部が有する重み係数の修正に利用される。
学習段階では、認識結果「Z」はフィードバック手段162に入力されて図8に示される正解「AZ」と比較され、各重み演算部が有する重み係数の修正に利用される。
ニューラルネットワークは、入力パターンのp個の因子[X1、X2、・・、Xi、・・、Xp]を変数、出力[Z]を計算値とする関数で表される。また、ニューラルネットワークの学習はp個の変数[X1、X2、・・、Xi、・・、Xp]から所期の値[Z]を出力する関数のパラメータ(定数)を選定する処理と言える。従って、コンピュータプログラムによりニューラルネットワークの機能を実現することにより、異なる形態のニューラルネットワークを任意の数生成することが可能であり、また、それらを用いた推定処理を並列的に実行することも可能である。
図1のニューラルネットワークの形態制御手段170はニューラルネットワークのノード数、学習のためのフィードバックの方法を選択する制御部であり、以下の機能を有している。
1.入力層152のノード数の選択
2.中間層153のノード数の選択
3.フィードバックの方法(伝搬関数)の選択
4.リンク荷重の選択
1.入力層152のノード数の選択
2.中間層153のノード数の選択
3.フィードバックの方法(伝搬関数)の選択
4.リンク荷重の選択
[入力層152のノード数の選択]
入力パターンを構成する複数(図1ではX1〜Xpのp個)の因子には、推定に必須の因子と、利用する利用しないを任意に選択可能な因子が存在する。形態制御手段170は選択可能な因子を利用するか利用しないかを決定し、必須の因子と選択した因子に対応する入力ノードで入力層152を決定する。当該機能により、入力層152のノード数と使用する因子が異なる複数の形態のニューラルネットワークを生成することが可能となる。
入力パターンを構成する複数(図1ではX1〜Xpのp個)の因子には、推定に必須の因子と、利用する利用しないを任意に選択可能な因子が存在する。形態制御手段170は選択可能な因子を利用するか利用しないかを決定し、必須の因子と選択した因子に対応する入力ノードで入力層152を決定する。当該機能により、入力層152のノード数と使用する因子が異なる複数の形態のニューラルネットワークを生成することが可能となる。
[中間層153のノード数の選択]
ニューラルネットワークの中間層の数と各中間層に属するノード数は任意に選択することが可能である。本実施態様では各中間層に属するノード数を0〜25の間でランダムに選択する構成となっている。ノード数が決定されると、中間層153の各ノード(j)と入力層152の各ノード(i)の間に信号路と重み演算部(Wij)を設定する。また、重み演算部(Wij)の重み係数(W ij)の初期値を設定する。
中間層153の各ノード(j)と出力層154のノード(z)の間に信号路と重み演算部(Wjz)を設定すると共に、当該重み演算部の重み係数(W jz)の初期値を設定する。重み係数(W ij)と(W jz)の初期値はランダムに設定される。中間層のノード数と重み係数の初期値はランダムに設定されるため、構成が異なる多数のニューラルネットワークを容易に生成することが可能である。
ニューラルネットワークの中間層の数と各中間層に属するノード数は任意に選択することが可能である。本実施態様では各中間層に属するノード数を0〜25の間でランダムに選択する構成となっている。ノード数が決定されると、中間層153の各ノード(j)と入力層152の各ノード(i)の間に信号路と重み演算部(Wij)を設定する。また、重み演算部(Wij)の重み係数(W ij)の初期値を設定する。
中間層153の各ノード(j)と出力層154のノード(z)の間に信号路と重み演算部(Wjz)を設定すると共に、当該重み演算部の重み係数(W jz)の初期値を設定する。重み係数(W ij)と(W jz)の初期値はランダムに設定される。中間層のノード数と重み係数の初期値はランダムに設定されるため、構成が異なる多数のニューラルネットワークを容易に生成することが可能である。
[フィードバック方法(伝搬関数)の選択]
ニューラルネットワークのフィードバックの形態、即ち、学習方法には、線形関数、動径関数等、多くの方法が知られている。本実施例では、線形関数、動径関数、一般回帰、誤差逆伝播によるフィードバック処理手段(プログラム)を設け、ニューラルネットワークを生成する際、上記フィードバック処理手段から一つの処理手段をランダムに選択し、フィードバック手段162を構成する。
ニューラルネットワークのフィードバックの形態、即ち、学習方法には、線形関数、動径関数等、多くの方法が知られている。本実施例では、線形関数、動径関数、一般回帰、誤差逆伝播によるフィードバック処理手段(プログラム)を設け、ニューラルネットワークを生成する際、上記フィードバック処理手段から一つの処理手段をランダムに選択し、フィードバック手段162を構成する。
[リンク荷重の選択]
リンク荷重の決定とは上記の伝播関数のパラメータを決定することであり、その決定方法には多くの数学的手法がある。本実施例では、バックプロパゲーション(誤差逆伝搬法)、共役勾配降下法、K-meansアルゴリズム(中心の割り当て)、最近隣法、擬似逆行行列(線形最小2乗最適化)からランダムに選択した方法に基づいて、上記伝播関数のパラメータを決定する構成となっている。
リンク荷重の決定とは上記の伝播関数のパラメータを決定することであり、その決定方法には多くの数学的手法がある。本実施例では、バックプロパゲーション(誤差逆伝搬法)、共役勾配降下法、K-meansアルゴリズム(中心の割り当て)、最近隣法、擬似逆行行列(線形最小2乗最適化)からランダムに選択した方法に基づいて、上記伝播関数のパラメータを決定する構成となっている。
構成が異なるニューラルネットワークであっても、それらを同一の学習パターンを用いて学習することにより、同じ推定動作を行うニューラルネットワークとすることが可能である。同じ学習が行われた異なる構成のニューラルネットワークに、「YES」または「NO」と推定される典型的なパターンと類似度が高い未知のパターンを入力すると、多くのニューラルネットワークは同じ推定結果を出力する。
しかし、未知のパターンが上記の典型的なパターンの何れとも大きく異なっている、即ち、未知のパターンが「YES」または「NO」と推定されるパターンの領域の境界近傍に位置すると、ニューラルネットワークが異なる推定結果を出力する場合がある。全ての推定結果に対する「YES」の割合(または「NO」の割合)は推定結果の確からしさを表している。例えば、糖尿病の発症を予測するように学習された複数のニューラルネットワークの70パーセントが「糖尿病になる」と予測し、30パーセントが「糖尿病にならない」と予測した場合、「糖尿病になる可能性は70パーセント」となる。
本発明は、構成が異なる複数のニューラルネットワークを用意して同一の学習を行い、学習が完了した複数のニューラルネットワークにより未知のデータの推定を行う。推定結果の「YES」または「NO」の割合から、推定結果の確からしさを数値化して出力するものである。
しかし、未知のパターンが上記の典型的なパターンの何れとも大きく異なっている、即ち、未知のパターンが「YES」または「NO」と推定されるパターンの領域の境界近傍に位置すると、ニューラルネットワークが異なる推定結果を出力する場合がある。全ての推定結果に対する「YES」の割合(または「NO」の割合)は推定結果の確からしさを表している。例えば、糖尿病の発症を予測するように学習された複数のニューラルネットワークの70パーセントが「糖尿病になる」と予測し、30パーセントが「糖尿病にならない」と予測した場合、「糖尿病になる可能性は70パーセント」となる。
本発明は、構成が異なる複数のニューラルネットワークを用意して同一の学習を行い、学習が完了した複数のニューラルネットワークにより未知のデータの推定を行う。推定結果の「YES」または「NO」の割合から、推定結果の確からしさを数値化して出力するものである。
図2は本発明に係るニューラルネットワークシステムの構築過程と推定過程の一例を示す図である。本実施態様は構成が異なるニューラルネットワークをM個(例えば、十数万個)生成して同一の学習パターンにより同一の学習を行う。学習が終了したM個のニューラルネットワークに複数の検証パターンの判定を行わせて各ニューラルネットワークの正解率を求め、推定の精度が高いニューラルネットワークをN個(例えば、百個)選択する構成となっている。
図2のニューラルネットワーク生成部401は、入力層のノード数、中間層のノード数、フィードバックの方法(伝搬関数)、リンク荷重の選択方法の全部、あるいは一部をランダムに変更して構成が異なるニューラルネットワークをM個生成する。生成された各ニューラルネットワークを規定するデータはデータブロックとし、ニューラルネットワーク記憶部402に記憶される。
学習パターン記憶部403にはニューラルネットワークの学習に使用する学習パターンとその正解データの対が複数、例えば200対記憶されている。6年後のメタボリックシンドロームの発症を予測する場合、健康診断において収集された200人の受診者の、年齢、性別、Body mass index、収縮期血圧(SBP)、拡張期血圧(DBP)、血中グルコース、中性脂肪、HDLコレステロール、LDLコレステロール、AST値、ALT値、HMW-adiponectin、total adiponectin、glycated albumin、総コレステロール、遊離脂肪酸、インシュリン、HOMA-IR、喫煙の有無等に関するデータと、各受診者が6年後の健康診断においてメタボリックシンドロームと診断されたか否かを示すデータが対にして記憶される。
学習パターン記憶部403にはニューラルネットワークの学習に使用する学習パターンとその正解データの対が複数、例えば200対記憶されている。6年後のメタボリックシンドロームの発症を予測する場合、健康診断において収集された200人の受診者の、年齢、性別、Body mass index、収縮期血圧(SBP)、拡張期血圧(DBP)、血中グルコース、中性脂肪、HDLコレステロール、LDLコレステロール、AST値、ALT値、HMW-adiponectin、total adiponectin、glycated albumin、総コレステロール、遊離脂肪酸、インシュリン、HOMA-IR、喫煙の有無等に関するデータと、各受診者が6年後の健康診断においてメタボリックシンドロームと診断されたか否かを示すデータが対にして記憶される。
学習部404は学習パターン記憶部403に記憶された学習パターンと正解データの対を用いて、ニューラルネットワーク記憶部402に記憶されているM個のニューラルネットワークの学習を行う。学習が完了したニューラルネットワークは学習済みニューラルネットワーク記憶部405に記憶される。
図3はニューラルネットワークをM個生成する処理421の後に実行される、学習パターンによりM個のニューラルネットワークを学習する処理の概念図である。ステップ421で、構成が異なるニューラルネットワークをM個(432−1〜432−M)生成し、ニューラルネットワーク記憶部402に記憶する。また、同記憶部402にはニューラルネットワーク432−1ないし432−M対応に、フィードバックの方法とリンク荷重の選択方法に関する情報が記憶される。
ステップ422で、学習部404はニューラルネットワーク記憶部402に記憶されているニューラルネットワーク432−1ないし432−Mの学習を行う。
学習パターン記憶部403から読み出された学習パターン430はニューラルネットワーク432−1ないし432−Mに入力される。学習パターン430から各ニューラルネットワークが推定した出力は、比較部433−1ないし433−Mにより、同じく学習パターン記憶部403から読み出された正解431と比較される。比較結果はフィードバック434−1ないし434−Mを介して各ニューラルネットワークに帰還され、重み係数の修正に使用される。重み係数の修正はニューラルネットワーク432−1ないし432−M対応にニューラルネットワーク記憶部402に記憶されているフィードバックの方法とリンク荷重の選択方法に関する情報に基づいて行われる。
上記動作はニューラルネットワーク432−1ないし432−Mの全ての学習が全て終了するまで繰り返される。学習が終了したニューラルネットワーク432−1ないし432−Mのデータは学習済みニューラルネットワーク記憶部405に記憶される。
図3はニューラルネットワークをM個生成する処理421の後に実行される、学習パターンによりM個のニューラルネットワークを学習する処理の概念図である。ステップ421で、構成が異なるニューラルネットワークをM個(432−1〜432−M)生成し、ニューラルネットワーク記憶部402に記憶する。また、同記憶部402にはニューラルネットワーク432−1ないし432−M対応に、フィードバックの方法とリンク荷重の選択方法に関する情報が記憶される。
ステップ422で、学習部404はニューラルネットワーク記憶部402に記憶されているニューラルネットワーク432−1ないし432−Mの学習を行う。
学習パターン記憶部403から読み出された学習パターン430はニューラルネットワーク432−1ないし432−Mに入力される。学習パターン430から各ニューラルネットワークが推定した出力は、比較部433−1ないし433−Mにより、同じく学習パターン記憶部403から読み出された正解431と比較される。比較結果はフィードバック434−1ないし434−Mを介して各ニューラルネットワークに帰還され、重み係数の修正に使用される。重み係数の修正はニューラルネットワーク432−1ないし432−M対応にニューラルネットワーク記憶部402に記憶されているフィードバックの方法とリンク荷重の選択方法に関する情報に基づいて行われる。
上記動作はニューラルネットワーク432−1ないし432−Mの全ての学習が全て終了するまで繰り返される。学習が終了したニューラルネットワーク432−1ないし432−Mのデータは学習済みニューラルネットワーク記憶部405に記憶される。
図2の検証パターン記憶部406には、検証パターンと正解データの対が記憶されている。検証パターンは学習パターンと同じ因子から構成されており、例えば、健康診断等で収集されたデータの一部を学習パターンとし、残りを検証パターンとすることにより作成可能である。検証部407は、学習済みニューラルネットワーク記憶部405に記憶されているニューラルネットワークの各々に検証パターンを入力し、その出力を正解データと比較し正解率を検証結果記憶部407に記憶する。
選択部408は検証結果記憶部407に記憶されているM個のニューラルネットワークの正解率を読み出し、正解率の高いN個を選択して選択ニューラルネットワーク記憶部409に記憶する。
選択部408は検証結果記憶部407に記憶されているM個のニューラルネットワークの正解率を読み出し、正解率の高いN個を選択して選択ニューラルネットワーク記憶部409に記憶する。
図4は検証部407が実行する各ニューラルネットワークの正解率を求める処理の概念図である。
ステップ441で、検証部407は検証パターン記憶部406から検証パターン450を読み出し、学習済みニューラルネットワーク記憶部405に記憶されているニューラルネットワーク432−1ないし432−Mに入力する。各ニューラルネットワークの出力は、比較部453−1ないし453−Mにより、検証パターン記憶部405から読み出された正解451と比較される。比較結果は正解/不正解のデータとして正解率管理手段454−1ないし454−Mに記憶される。全ての検証パターンの検証が終了すると、正解率管理手段454−1ないし454−Mは記憶された正解/不正解のデータから正解率を計算して記憶し、ステップ441を終了する。
ステップ442で、図2の選択部408は正解率管理手段454−1ないし454−Mに記憶されている正解率を検証し、正解率が高いニューラルネットワークをN個、例えば100個選択し選択ニューラルネットワーク記憶部409に記憶する。当該処理が終了することにより、本発明に係るニューラルネットワークの生成は終了する。
ステップ441で、検証部407は検証パターン記憶部406から検証パターン450を読み出し、学習済みニューラルネットワーク記憶部405に記憶されているニューラルネットワーク432−1ないし432−Mに入力する。各ニューラルネットワークの出力は、比較部453−1ないし453−Mにより、検証パターン記憶部405から読み出された正解451と比較される。比較結果は正解/不正解のデータとして正解率管理手段454−1ないし454−Mに記憶される。全ての検証パターンの検証が終了すると、正解率管理手段454−1ないし454−Mは記憶された正解/不正解のデータから正解率を計算して記憶し、ステップ441を終了する。
ステップ442で、図2の選択部408は正解率管理手段454−1ないし454−Mに記憶されている正解率を検証し、正解率が高いニューラルネットワークをN個、例えば100個選択し選択ニューラルネットワーク記憶部409に記憶する。当該処理が終了することにより、本発明に係るニューラルネットワークの生成は終了する。
図2の認識部412は、コンピュータのキーボート、あるいはデータ記憶装置等の外部装置から読み取られた判定すべきデータ410を、判定パターン入力部411を介して受信し、選択ニューラルネットワーク記憶部406に記憶されているN個のニューラルネットワークに入力する。確度算出部413はN個のニューラルネットワークが出力したN個の判定結果を受け取り、判定結果が「YES」(または「NO」)の割合を算出して出力する。
図5は認識部412と確度算出部413が実行する判定パターンに対する認識の確度を求める処理の概念図である。
ステップ461で、認識部412は判定パターン入力部411を介して受信した判定パターン470を選択ニューラルネットワーク記憶部409に記憶されているニューラルネットワーク471−1ないし471−Nの各々に入力し、各判定結果を確度算出部413に送信する。
ステップ462で、確度算出部413は「YES」(または「NO」)の判定結果の割合を当該判定の確度473として出力する。
図5は認識部412と確度算出部413が実行する判定パターンに対する認識の確度を求める処理の概念図である。
ステップ461で、認識部412は判定パターン入力部411を介して受信した判定パターン470を選択ニューラルネットワーク記憶部409に記憶されているニューラルネットワーク471−1ないし471−Nの各々に入力し、各判定結果を確度算出部413に送信する。
ステップ462で、確度算出部413は「YES」(または「NO」)の判定結果の割合を当該判定の確度473として出力する。
本発明は内部の構成は異なるが、同一の学習パターンにより学習された複数のニューラルネットワークにより未知のパターンの原因等を推定し、推定結果と共にその推定の確からしさを数値化して出力することを可能とするものである。
図1ないし図5に示される実施態様は、出力層のノードは1つであり、1つの事象、例えば「糖尿病になる/ならない」を推定する構成である。しかし、図7(b)に示されるように、出力層のノードを複数とし、各ノードに異なる事象を割り当てる構成も可能である。例えば、出力層のノード1には疾患A、ノード2には疾患B・・・・を割り当てることにより、1つの判定パターンから、疾患Aの可能性はXパーセント、疾患Bの可能性はYパーセント・・・等、複数の推定結果を同時に得ることが可能となる。
図1ないし図5に示される実施態様は、出力層のノードは1つであり、1つの事象、例えば「糖尿病になる/ならない」を推定する構成である。しかし、図7(b)に示されるように、出力層のノードを複数とし、各ノードに異なる事象を割り当てる構成も可能である。例えば、出力層のノード1には疾患A、ノード2には疾患B・・・・を割り当てることにより、1つの判定パターンから、疾患Aの可能性はXパーセント、疾患Bの可能性はYパーセント・・・等、複数の推定結果を同時に得ることが可能となる。
本発明に係るニューラルネットワークシステムは1つの独立したコンピュータシステムとして構成することも、LANあるいはインターネットにより結合されたネットワーク構成とすることも可能である。図6は本発明に係るニューラルネットワークシステムを構成する装置をLANにより接続した例である。1台又は複数台のパーソナルコンピュータ301(図6には1台のみが図示されている)と、サーバ310と、検査装置320等他の装置がLAN300により接続されている。
パーソナルコンピュータ301は、プログラムを実行する処理装置302と、処理装置302が実行するプログラムあるいはデータを記憶するローカルファイル装置303、キーボード、マウス、カードリーダ等の入力装置304、表示装置、プリンター等の出力装置305等を有している。
パーソナルコンピュータ301は、プログラムを実行する処理装置302と、処理装置302が実行するプログラムあるいはデータを記憶するローカルファイル装置303、キーボード、マウス、カードリーダ等の入力装置304、表示装置、プリンター等の出力装置305等を有している。
サーバ310は、指示されたプログラムを実行し且つネットワークに接続されている他の装置との間でデータの授受を行うサーバ処理部311、ニューラルネットワークを生成し学習に必要なプログラムとデータを格納するANN生成用データファィル装置312、図2のニューラルネットワーク記憶部402、学習済みニューラルネットワーク記憶部405、選択ニューラルネットワーク記憶部409となるANNファィル装置313、学習パターン430及び検証パターン450を記憶するパターンファイル装置314、及び図示されていないコンソール用の入出力装置等からなっている。
サーバ処理部311が実行するプログラムには、図2に示されるニューラルネットワークの生成部401に対応するニューラルネットワークを表す関数を生成するプログラム、学習部404に対応する関数の学習処理を行うプログラム、検証部407および選択部408に対応する学習が終了した関数から正解率の高い関数を選別する選別プログラム、認識部412及び確度算出部413に対応する選別された関数を用いて推論を行う推論プログラム等のプログラムが存在する。また、LAN300には検査装置320等の装置が接続されており、パーソナルコンピュータ301から利用可能となっている。
サーバ処理部311が実行するプログラムには、図2に示されるニューラルネットワークの生成部401に対応するニューラルネットワークを表す関数を生成するプログラム、学習部404に対応する関数の学習処理を行うプログラム、検証部407および選択部408に対応する学習が終了した関数から正解率の高い関数を選別する選別プログラム、認識部412及び確度算出部413に対応する選別された関数を用いて推論を行う推論プログラム等のプログラムが存在する。また、LAN300には検査装置320等の装置が接続されており、パーソナルコンピュータ301から利用可能となっている。
ニューラルネットワークシステムを生成する時、パーソナルコンピュータ301の入力装置304、あるいはサーバ310のコンソールの入力装置から、サーバ処理部311にニューラルネットワークシステムの生成を指示する。指示にはニューラルネットワークシステムの性能に関する指示と共に、パターンファイル装置314に記憶されている学習パターンと検証パターンのファイルを指定する。
サーバ処理部311は入力装置からの指示に従い、ニューラルネットワークの生成、学習、検証、選択を実行し、ANNファィル装置313の選択ニューラルネットワーク記憶部409に選択されたニューラルネットワークを記憶する。
使用者がパーソナルコンピュータ301からニューラルネットワークシステムを利用する際、キーボートあるいは他の入力装置304を使用して判定するデータをサーバ310に送信する。サーバ処理部311の推論プログラムは、選択ニューラルネットワーク記憶部409に記憶されているニューラルネットワークを用いて判定データの判定処理(図2の412)を実行し、その結果をパーソナルコンピュータ301の出力装置から出力(図2の413)する。
サーバ処理部311は入力装置からの指示に従い、ニューラルネットワークの生成、学習、検証、選択を実行し、ANNファィル装置313の選択ニューラルネットワーク記憶部409に選択されたニューラルネットワークを記憶する。
使用者がパーソナルコンピュータ301からニューラルネットワークシステムを利用する際、キーボートあるいは他の入力装置304を使用して判定するデータをサーバ310に送信する。サーバ処理部311の推論プログラムは、選択ニューラルネットワーク記憶部409に記憶されているニューラルネットワークを用いて判定データの判定処理(図2の412)を実行し、その結果をパーソナルコンピュータ301の出力装置から出力(図2の413)する。
本発明はニューラルネットワークを利用して医療の診断等に使用する推論システムに関するものであり、システムを内部構成が異なるが、同一の学習が行われた複数のニューラルネットワークにより構成するものである。
診断等においては診断の確度はどれくらいなのか、疾患に罹患する恐れはどの程度であるか等の情報は治療等の大きな判断要素となる。しかし、従来のニューラルネットワークから得られる予測は「罹患する」か「罹患しない」のいずれかであり、罹患する確率はどの程度なのか等、予測の確からしさを得ることはできなかった。
本発明は複数のニューラルネットワークを用いて予測を行い、予測のばらつきから予測の確度を求めるものである。利用者は「YES」か「NO」の予測みではなく、「YES」の予測の確度、或いは「YES」の状況が発生する確率を知ることが可能となる。
診断等においては診断の確度はどれくらいなのか、疾患に罹患する恐れはどの程度であるか等の情報は治療等の大きな判断要素となる。しかし、従来のニューラルネットワークから得られる予測は「罹患する」か「罹患しない」のいずれかであり、罹患する確率はどの程度なのか等、予測の確からしさを得ることはできなかった。
本発明は複数のニューラルネットワークを用いて予測を行い、予測のばらつきから予測の確度を求めるものである。利用者は「YES」か「NO」の予測みではなく、「YES」の予測の確度、或いは「YES」の状況が発生する確率を知ることが可能となる。
また、複数のニューラルネットワークを選択する構成として、入力層のノード数、中間層のノード数、フィードバックの方法(伝搬関数)、リンク荷重選択方法の異なるニューラルネットワークを多数作成して学習と検証を行ない、予測性能の高いニューラルネットワークを選別する構成とすることが可能である。当該構成を採用することにより、予測性能を高めると共に予測の確度の精度を高めることが可能となる。
Claims (5)
- 内部構成が異なるN個(Nは2以上)のニューラルネットワークと、
前記N個のニューラルネットワークに同一の学習を行う学習手段と、
学習が終了した前記N個のニューラルネットワークに判定すべきデータを入力する判定データ入力手段と、
前記判定すべきデータに対する前記N個のニューラルネットワークの判定結果から特定の判定の割合を算出する確度算出手段と、
前記確度算出手段が算出した値を前記特定の判定の確度として出力する出力手段とからなることを特徴とするニューラルネットワークシステム。 - 請求項1記載のニューラルネットワークシステムであって、
前記複数のニューラルネットワークの各々は入力層と中間層と出力層を有し、
前記学習はフィードバック伝搬関数とリンクの荷重により決定されるものであり、
前記入力層のノード数、前記中間層ノード数、前記フィードバック伝搬関数、前記リンクの荷重の選択方法の少なくとも1つが異なることにより内部構成が異なっていることを特徴とするニューラルネットワークシステム。 - 請求項1または請求項2記載のニューラルネットワークシステムであって、
内部構成が異なるM個(MはNより大)のニューラルネットワークを生成するニューラルネットワーク生成手段を有し、
前記学習手段は前記M個のニューラルネットワークに同一の学習を行うものであり、
学習が終了した前記M個のニューラルネットワークから推定精度が高いN個のニューラルネットワークを選択する選択手段を有することを特徴とするニューラルネットワークシステム。 - 内部構成が異なるM個(MはNより大)のニューラルネットワークを生成するニューラルネットワーク生成ステップと、
前記M個のニューラルネットワークに同一の学習を行う学習ステップと、
学習が終了した前記M個のニューラルネットワークから推定精度が高いN個のニューラルネットワークを選択する選択ステップと、
前記N個のニューラルネットワークに判定すべきデータを入力する判定データ入力ステップと、
前記判定すべきデータに対する前記N個のニューラルネットワークの判定結果から特定の判定の割合を算出する確度算出ステップと、
前記確度算出ステップが算出した値を前記特定の判定の確度として出力する出力ステップとからなることを特徴とするニューラルネットワークの制御方法。 - 内部構成が異なるM個(MはNより大)のニューラルネットワークを生成するニューラルネットワーク生成ステップと、
前記M個のニューラルネットワークに同一の学習を行う学習ステップと、
学習が終了した前記M個のニューラルネットワークから推定精度が高いN個のニューラルネットワークを選択する選択ステップと、
前記N個のニューラルネットワークに判定すべきデータを入力する判定データ入力ステップと、
前記判定すべきデータに対する前記N個のニューラルネットワークの判定結果から特定の判定の割合を算出する確度算出ステップと、
前記確度算出ステップが算出した値を前記特定の判定の確度として出力する出力ステップをコンピュータに実行させることを特徴とするニューラルネットワークの制御プログラム。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010153765A JP2012018450A (ja) | 2010-07-06 | 2010-07-06 | ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2010153765A JP2012018450A (ja) | 2010-07-06 | 2010-07-06 | ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2012018450A true JP2012018450A (ja) | 2012-01-26 |
Family
ID=45603675
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2010153765A Withdrawn JP2012018450A (ja) | 2010-07-06 | 2010-07-06 | ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2012018450A (ja) |
Cited By (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013248329A (ja) * | 2012-06-04 | 2013-12-12 | Fujitsu Ltd | 健康状態判定方法および装置 |
| JP2016066269A (ja) * | 2014-09-25 | 2016-04-28 | Kddi株式会社 | クラスタリング装置、方法及びプログラム |
| KR101855360B1 (ko) * | 2017-12-13 | 2018-05-09 | 한국과학기술정보연구원 | 신경망의 학습 최적화를 위한 신경망 구성 방법 및 장치 |
| JP2019003267A (ja) * | 2017-06-12 | 2019-01-10 | 株式会社大塚商会 | Aiサービス利用支援システム |
| JP2019028950A (ja) * | 2017-08-03 | 2019-02-21 | 株式会社大塚商会 | Aiサービス利用支援システム |
| JP2019049916A (ja) * | 2017-09-12 | 2019-03-28 | 株式会社アクセル | 処理装置及び推論処理方法 |
| KR20190048274A (ko) * | 2017-10-31 | 2019-05-09 | 전자부품연구원 | 다중 아날로그 제어 변수 생성을 위한 다중 뉴럴 네트워크 구성 방법 |
| JP2019106112A (ja) * | 2017-12-14 | 2019-06-27 | オムロン株式会社 | 情報処理装置、識別システム、設定方法及びプログラム |
| CN110059799A (zh) * | 2018-01-19 | 2019-07-26 | 国际商业机器公司 | 包含中间层背景的神经网络的生成 |
| JP2019159693A (ja) * | 2018-03-12 | 2019-09-19 | Kddi株式会社 | 情報処理装置、情報処理端末、及びプログラム |
| CN110610234A (zh) * | 2018-06-14 | 2019-12-24 | 国际商业机器公司 | 将外部应用程序集成到深度神经网络中 |
| JP2020060803A (ja) * | 2018-10-04 | 2020-04-16 | 株式会社カネカ | 健康情報処理方法、健康情報処理装置、コンピュータプログラム、及び学習モデル |
| JP2020123384A (ja) * | 2020-04-17 | 2020-08-13 | 株式会社アクセル | 処理装置及び推論処理方法 |
| CN113169927A (zh) * | 2018-12-12 | 2021-07-23 | 株式会社自动网络技术研究所 | 判定装置、判定程序、判定方法及神经网络模型的生成方法 |
| JP2023098890A (ja) * | 2019-03-28 | 2023-07-11 | 京セラ株式会社 | 推定装置、推定システム、制御プログラム |
-
2010
- 2010-07-06 JP JP2010153765A patent/JP2012018450A/ja not_active Withdrawn
Cited By (23)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2013248329A (ja) * | 2012-06-04 | 2013-12-12 | Fujitsu Ltd | 健康状態判定方法および装置 |
| JP2016066269A (ja) * | 2014-09-25 | 2016-04-28 | Kddi株式会社 | クラスタリング装置、方法及びプログラム |
| JP2019003267A (ja) * | 2017-06-12 | 2019-01-10 | 株式会社大塚商会 | Aiサービス利用支援システム |
| JP2019028950A (ja) * | 2017-08-03 | 2019-02-21 | 株式会社大塚商会 | Aiサービス利用支援システム |
| JP2019049916A (ja) * | 2017-09-12 | 2019-03-28 | 株式会社アクセル | 処理装置及び推論処理方法 |
| KR20190048274A (ko) * | 2017-10-31 | 2019-05-09 | 전자부품연구원 | 다중 아날로그 제어 변수 생성을 위한 다중 뉴럴 네트워크 구성 방법 |
| KR102527605B1 (ko) | 2017-10-31 | 2023-05-02 | 한국전자기술연구원 | 다중 아날로그 제어 변수 생성을 위한 다중 뉴럴 네트워크 구성 방법 |
| KR101855360B1 (ko) * | 2017-12-13 | 2018-05-09 | 한국과학기술정보연구원 | 신경망의 학습 최적화를 위한 신경망 구성 방법 및 장치 |
| JP6992475B2 (ja) | 2017-12-14 | 2022-01-13 | オムロン株式会社 | 情報処理装置、識別システム、設定方法及びプログラム |
| JP2019106112A (ja) * | 2017-12-14 | 2019-06-27 | オムロン株式会社 | 情報処理装置、識別システム、設定方法及びプログラム |
| CN110059799A (zh) * | 2018-01-19 | 2019-07-26 | 国际商业机器公司 | 包含中间层背景的神经网络的生成 |
| US12182711B2 (en) | 2018-01-19 | 2024-12-31 | International Business Machines Corporation | Generation of neural network containing middle layer background |
| US12020160B2 (en) | 2018-01-19 | 2024-06-25 | International Business Machines Corporation | Generation of neural network containing middle layer background |
| JP2019159693A (ja) * | 2018-03-12 | 2019-09-19 | Kddi株式会社 | 情報処理装置、情報処理端末、及びプログラム |
| CN110610234A (zh) * | 2018-06-14 | 2019-12-24 | 国际商业机器公司 | 将外部应用程序集成到深度神经网络中 |
| CN110610234B (zh) * | 2018-06-14 | 2023-04-07 | 国际商业机器公司 | 将外部应用程序集成到深度神经网络中 |
| JP7190859B2 (ja) | 2018-10-04 | 2022-12-16 | 株式会社カネカ | 健康情報処理方法、健康情報処理装置、コンピュータプログラム、及び学習モデル |
| JP2020060803A (ja) * | 2018-10-04 | 2020-04-16 | 株式会社カネカ | 健康情報処理方法、健康情報処理装置、コンピュータプログラム、及び学習モデル |
| CN113169927B (zh) * | 2018-12-12 | 2023-01-03 | 株式会社自动网络技术研究所 | 判定装置、判定程序、判定方法及神经网络模型的生成方法 |
| CN113169927A (zh) * | 2018-12-12 | 2021-07-23 | 株式会社自动网络技术研究所 | 判定装置、判定程序、判定方法及神经网络模型的生成方法 |
| JP2023098890A (ja) * | 2019-03-28 | 2023-07-11 | 京セラ株式会社 | 推定装置、推定システム、制御プログラム |
| JP7454724B2 (ja) | 2019-03-28 | 2024-03-22 | 京セラ株式会社 | 推定装置、推定システム、制御プログラム |
| JP2020123384A (ja) * | 2020-04-17 | 2020-08-13 | 株式会社アクセル | 処理装置及び推論処理方法 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JP2012018450A (ja) | ニューラルネットワークシステム、ニューラルネットワークシステムの構築方法およびニューラルネットワークシステムの制御プログラム | |
| Chen et al. | Early prediction of coronary artery disease (CAD) by machine learning method-a comparative study | |
| KR102024375B1 (ko) | 만성신장 질환의 질병 위험도를 예측하는 장치 및 방법 | |
| Orphanou et al. | DBN-extended: a dynamic Bayesian network model extended with temporal abstractions for coronary heart disease prognosis | |
| CN107743630A (zh) | 使用循环神经网络预测满足条件的可能性 | |
| Mokeddem et al. | Supervised feature selection for diagnosis of coronary artery disease based on genetic algorithm | |
| Lafta et al. | An intelligent recommender system based on short-term risk prediction for heart disease patients | |
| Akula et al. | Supervised machine learning based ensemble model for accurate prediction of type 2 diabetes | |
| JP7173482B2 (ja) | ヘルスケアデータ分析システム、ヘルスケアデータ分析方法およびヘルスケアデータ分析プログラム | |
| WO2020045245A1 (ja) | 状態遷移予測装置、予測モデル学習装置、方法およびプログラム | |
| US20200058399A1 (en) | Control method and reinforcement learning for medical system | |
| Kumar et al. | Identification of cardiac patients based on the medical conditions using machine learning models | |
| Ashrafi et al. | Effect of a process mining based pre-processing step in prediction of the critical health outcomes | |
| Berchialla et al. | Integrating stress‐related ventricular functional and angiographic data in preventive cardiology: a unified approach implementing a Bayesian network | |
| Shuvo | An early detection of heart disease using machine learning (recurrent neural network): ML research on heart disease prediction | |
| Fidele et al. | Artificial Neural Network as a Clinical Decision-Supporting | |
| Sinha et al. | CARDPSoML: Comparative approach to analyze and predict cardiovascular disease based on medical report data and feature fusion approach | |
| de Lucena et al. | Predictive Performance of Machine Learning Algorithms Regarding Obesity Levels Based on Physical Activity and Nutritional Habits: A Comprehensive Analysis | |
| Mischie et al. | Artificial neural networks for diagnosis of coronary heart disease | |
| Haynatzki et al. | Building machine learning models to improve hypertension diagnosis | |
| Putzel et al. | Dynamic survival analysis for ehr data with personalized parametric distributions | |
| KR20260014812A (ko) | 인공지능을 이용한 낙상 외인 코드 예측 시스템 및 그 방법 | |
| US20250099000A1 (en) | Determining likelihood of kidney failure | |
| You et al. | A nonparametric control chart for dynamic disease risk monitoring | |
| Zulkifli et al. | Implementation of a Diabetes Status Prediction Application Using a Machine Learning Algorithm Approach |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20131001 |