[go: up one dir, main page]

JP2005070919A - Recall type information storage device - Google Patents

Recall type information storage device Download PDF

Info

Publication number
JP2005070919A
JP2005070919A JP2003296851A JP2003296851A JP2005070919A JP 2005070919 A JP2005070919 A JP 2005070919A JP 2003296851 A JP2003296851 A JP 2003296851A JP 2003296851 A JP2003296851 A JP 2003296851A JP 2005070919 A JP2005070919 A JP 2005070919A
Authority
JP
Japan
Prior art keywords
information
recall
existing
episode
key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003296851A
Other languages
Japanese (ja)
Inventor
Masakatsu Ota
昌克 太田
Hitoshi Yamaguchi
仁 山口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2003296851A priority Critical patent/JP2005070919A/en
Publication of JP2005070919A publication Critical patent/JP2005070919A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

【課題】 ユーザのキー情報入力に応じて、既存情報の中から有用な関連情報を取り出すための想起型情報装置を提供する。
【解決手段】 既存情報及び想起度を格納したデータベース103と、関連情報の取り出され方に関するパラメータの入力、キー情報の入力、新たに既存情報として登録する情報の入力、及び、取り出された関連情報の出力を行う入出力手段101と、キー情報と既存情報間及び既存情報間の類似度を計算する類似度計算手段104と、データベース103に格納された各既存情報の想起度、キー情報と既存情報間の類似度、既存情報間の類似度、及び、パラメータを用いて、各既存情報に付与された想起度を計算し、時間変化させる想起度計算手段105と、データベース103から、予め設定された閾値以上の想起度が付与された既存情報をキー情報の関連情報として取り出す制御手段102を備える。
【選択図】 図1
PROBLEM TO BE SOLVED: To provide a recall type information device for extracting useful related information from existing information in response to a user's key information input.
A database 103 storing existing information and a degree of recall, input of parameters regarding how to extract related information, input of key information, input of information newly registered as existing information, and extracted related information The input / output means 101 for outputting, the similarity calculation means 104 for calculating the similarity between the key information and the existing information, and the recall of each existing information stored in the database 103, the key information and the existing The degree of recall given to each existing information is calculated using the similarity between information, the degree of similarity between existing information, and parameters, and is set in advance from the database 103 and the recall degree calculating means 105 that changes over time. The control means 102 which takes out the existing information to which the recall degree more than the threshold value was given as the relevant information of key information is provided.
[Selection] Figure 1

Description

本発明は、個人情報端末等における情報の格納と取り出しを支援する技術に関し、特に、ユーザのキー情報の入力に応じて、ユーザの持つ既存情報の中から有用な関連情報を取り出す想起型情報記憶装置に関するものである。   The present invention relates to a technology for supporting storage and retrieval of information in a personal information terminal or the like, and in particular, a recollective information storage that retrieves useful related information from existing information held by a user in response to input of key information by the user. It relates to the device.

コンピュータネットワークやPDA(Personal Digital Assistant)等の個人情報端末の普及により、大量の情報を容易に収集できるようになってきた。これらの情報には、電子メール、メモ、WWW上のコンテンツ、写真等の様々なものがあるために、内容や目的に応じて厳密に分類し階層的に管理する方法では柔軟に対応できない。   With the spread of personal information terminals such as computer networks and PDAs (Personal Digital Assistants), a large amount of information can be easily collected. Since there is a variety of information such as e-mails, memos, WWW content, and photos, this information cannot be flexibly handled by a method that is strictly classified and managed hierarchically according to the content and purpose.

従来、このような大量で多様な情報を効率的に格納し、かつ必要に応じて有用な情報のみを効率的に取り出すための整理・管理方法として、例えば、次のような方法が提案されている。第1の方法は、内容を問わず情報を時間順に配列して管理する方法であり(例えば、非特許文献1参照)、分類項目の設定やどの分類項目に情報を分類すべきかといった問題を回避することができる。第2の方法は、コンピュータのデスクトップ環境の状態を時間管理する方法であり(例えば、非特許文献2参照)、デスクトップ上の情報の配置状況をそのまま時間順に記録するため、当時行っていた仕事や作業内容を必要に応じて再現することができる。また、第2の方法では、情報の削除、新たな情報の生成などデスクトップ環境に施された変更履歴も時間順に管理される。特に、情報の削除については、情報自体がコンピュータ上から完全に消去されるわけではなく、「デスクトップ上から削除された」という作業履歴が記録されるため、後に削除した情報が必要になればそれがデスクトップ上に存在した時点まで遡り、その情報を再現することができる。デスクトップ環境を時間軸に沿って切り替えるために、指定した情報がデスクトップ上に現れる時点や生成・削除された時点を検索する機能も提供されている。   Conventionally, for example, the following methods have been proposed as an organization and management method for efficiently storing such a large amount of diverse information and efficiently extracting only useful information as necessary. Yes. The first method is a method in which information is arranged and managed in chronological order regardless of the contents (see, for example, Non-Patent Document 1), and avoids problems such as setting of classification items and in which classification item information should be classified. can do. The second method is a method for time management of the state of the desktop environment of the computer (see, for example, Non-Patent Document 2). Since the arrangement status of information on the desktop is recorded in time order as it is, Work content can be reproduced as needed. In the second method, the change history applied to the desktop environment such as deletion of information and generation of new information is also managed in time order. In particular, when deleting information, the information itself is not completely deleted from the computer, but a work history of “deleted from the desktop” is recorded. Can be traced back to when it was on the desktop. In order to switch the desktop environment along the time axis, there is also provided a function for searching when specified information appears on the desktop, and when it is created / deleted.

しかしながら、上記従来技術には以下に示すような問題がある。ユーザが過去の情報を取り出す場合には、現在直面している問題や案件等について、過去に似たような体験や出来事を見つけ出し、それらを参考にして現状の問題解決を行うような場合もある。この時、現状の問題と全く同じ条件に見合った情報が過去に存在するとは限らないため、一部の条件を満足する関連情報を順々に参照することで問題解決の糸口を見出せる可能性がある。   However, the above prior art has the following problems. When users retrieve past information, they may find similar experiences and events in the past for problems and issues they are currently facing, and use them to solve current problems. . At this time, information that matches exactly the same conditions as the current problem does not always exist in the past, so there is a possibility that you can find clues to solve the problem by sequentially referencing related information that satisfies some conditions. is there.

上記従来技術では、所望する情報が明確な場合にはその情報が存在する時点に遡ってそれを取り出したり、所望する情報と同じ時点に存在する情報を関連情報として取り出すことはできるものの、参照すべき時点が多い場合や各時点に含まれる関連情報が少ない場合には、この作業はユーザにとって負荷が高いものとなる。また、各時点では目的や活動に応じて様々な情報が存在しており、同じ時点に存在したというだけでそれらの情報間に有用な関連があるとは言えない場合もあり、このような場合には時間を遡った関連情報の引き出しは有効ではない。さらに、あまりにも多くの情報を関連情報として取り出してしまうと、真に有用な情報が埋もれてしまうことから、取り出される関連情報の数を制御する手段が必要とされる。   In the above prior art, when the desired information is clear, it can be extracted retroactively to the time when the information exists, or information existing at the same time as the desired information can be extracted as related information. When there are many time points to be processed or when there is little related information included in each time point, this work is burdensome for the user. In addition, there are various types of information depending on the purpose and activity at each point in time, and it may not be said that there is a useful relationship between these pieces of information just because they existed at the same point in time. It is not effective to extract relevant information back in time. Furthermore, if too much information is extracted as related information, truly useful information is buried, so a means for controlling the number of related information to be extracted is required.

E.Freeman and D.Gelernter,Lifestreams: “A storage model for personal data”,ACM SIGMOD Bulletin,28,March 1996E. Freeman and D.C. Gelernter, Lifestreams: “A storage model for personal data”, ACM SIGMOD Bulletin, 28, March 1996. Jun Rekimoto,Time−Machine Computing: “A Time−centricApproach for the Informat ion Environment”,ACMUIST’99,1999Jun Rekimoto, Time-Machine Computing: "A Time-centric Approach for the Information Environment", ACMIST'99, 1999.

本発明は、上記のような問題を解決するためになされたものであり、既存情報と関連情報を取り出すキーとなる情報間、及び既存情報間の類似性をもとに、キー情報と直接関連する既存情報のみならず間接的に関連する既存情報も関連情報として取り出すことを可能とする想起型情報記憶装置を提供することにある。
また、本発明は、関連情報が取り出されてきた過程に応じて、既存情報に付与されたそれを取り出すべきか否かの度合いを表す想起度を調整することにより、有用な既存情報のみを関連情報として取り出すこと可能とする想起型情報記憶装置を提供することにある。
また、本発明は、想起度の平均値を制御することにより、取り出される関連情報の数を調整すること、及び関連情報が取り出されてきた過程が新たな関連情報の取り出しに及ぼす影響を調整することを可能とする想起型情報記憶装置を提供することにある。
The present invention has been made to solve the above problems, and is directly related to key information based on similarity between existing information and information used as a key for retrieving related information and existing information. Another object of the present invention is to provide a recall type information storage device that can extract not only existing information but also indirectly related existing information as related information.
In addition, according to the process in which the related information has been extracted, the present invention relates only to useful existing information by adjusting the recall level indicating whether or not the information given to the existing information should be extracted. An object of the present invention is to provide a recall type information storage device that can be taken out as information.
In addition, the present invention adjusts the number of related information to be extracted by controlling the average value of the degree of recall, and adjusts the influence of the process in which the related information has been extracted on the extraction of new related information. It is an object of the present invention to provide a recall type information storage device that enables the above.

本発明の想起型情報記憶装置は、既存情報及び当該既存情報を取り出すべきか否かの度合いを表わす想起度を格納したデータベースと、関連情報の取り出され方に関するパラメータの入力、キー情報の入力、新たに既存情報として登録する情報の入力、及び、取り出された関連情報の出力を行う入出力手段と、キー情報と既存情報間の類似度及び既存情報間の類似度を計算する類似度計算手段と、前記データベースに格納された各既存情報の想起度、前記キー情報と既存情報間の類似度、前記既存情報間の類似度、及び、前記関連情報の取り出され方に関するパラメータを用いて、各既存情報に付与された想起度を計算し、時間変化させる想起度計算手段と、前記データベースから、予め設定された閾値以上の想起度がを付与された既存情報をキー情報の関連情報として取り出す制御手段とを備える。   The recall type information storage device of the present invention includes a database storing existing information and a degree of recall indicating whether or not the existing information should be extracted, input of parameters regarding how to extract related information, input of key information, Input / output means for inputting information to be newly registered as existing information and outputting the extracted related information, and similarity calculation means for calculating similarity between key information and existing information and similarity between existing information And using parameters relating to the recall of each existing information stored in the database, the similarity between the key information and the existing information, the similarity between the existing information, and how to extract the related information, The degree of recall given to the existing information is calculated and the degree of recall is calculated, and the existing information to which the degree of recall equal to or higher than a preset threshold is given from the database. And a control means for retrieving the related information of the key information.

ここで、既存情報をエピソード、エピソードの中から関連するエピソードを取り出すためのキーとなる情報をキーエピソードと呼ぶことにする。また、キーエピソードとエピソードについては、それ自身を説明するための属性情報(以後、メタ情報と呼ぶ)も併せて提供されるものとする。   Here, existing information is used as an episode, and information used as a key for extracting a related episode from the episode is referred to as a key episode. In addition, for key episodes and episodes, attribute information (hereinafter referred to as meta information) for explaining itself is also provided.

キーエピソードやエピソード間の類似性を示す類似度はメタ情報を使って計算される。エピソードには、それが取り出されるべきか否かの度合いを表す想起度が付与されており、その値が設定した閾値を超えた場合、そのエピソードを関連エピソードとしてユーザに提示する。   Similarities indicating key episodes and similarities between episodes are calculated using meta information. The episode is given a recall level indicating whether or not it should be taken out, and when the value exceeds a set threshold, the episode is presented to the user as a related episode.

各エピソードは、自身と類似するキーエピソードが入力された場合、及び自身と類似性が高く、かつ大きな想起度を持つエピソードが他に存在する場合に、自身の想起度を類似度と想起度の積に比例して時間とともに増加させる。これにより、キーエピソードに直接関連するエピソードが取り出すことができるとともに、直接関連するエピソードと関連したエピソードも間接的にキーエピソードに関連するエピソードとして取り出すことができる。   For each episode, if a key episode similar to itself is entered, and if there are other episodes that have a high degree of recollection and high relevance, the degree of recollection Increase with time in proportion to product. Thereby, the episode directly related to the key episode can be taken out, and the episode related to the directly related episode can also be taken out indirectly as the episode related to the key episode.

一方、各エピソードは、他の類似するエピソードに対しては、相手の想起度を類似度と想起度の積に比例して時間とともに減少させる。この想起度の抑制作用により、多数のエピソードにおいて想起度が連鎖的に増大することを防ぐ。これらのエピソード間での想起度の調整の他に、各エピソードの想起度をその大きさに比例して時間と共に減少させることにより、他に関連するエピソードが存在しない、或いは関連するキーエピソードが入力されないエピソードについては、不要な古いエピソードとして時間とともに想起度が減少し取り出せれなくなっていく。   On the other hand, with respect to other similar episodes, each episode decreases the opponent's recall level with time in proportion to the product of the similarity level and the recall level. This suppressive action of the recall level prevents the recall level from increasing in a number of episodes. In addition to adjusting the recall level between these episodes, the recall level of each episode is decreased with time in proportion to its size, so that no other related episodes exist or related key episodes are entered For episodes that are not performed, the degree of recall decreases with time as an unneeded old episode, making it impossible to extract.

以上の想起度の計算では、より多くの関連するキーエピソードが入力されたエピソードほど想起度が大きくなり、また現在の想起度に依存して想起度が時間とともに変化していく。従って、類似度だけで関連性を判断する場合には常に同じエピソードが関連エピソードとして取り出されるのに対し、本発明ではキーエピソードが入力される履歴に依存して想起度が変化し、過去により多く引き出されたエピソードほど有用なエピソードとして取り出されるようになっていく。   In the calculation of the degree of recall, the degree of recall increases as the number of related key episodes input, and the degree of recall changes with time depending on the current degree of recall. Therefore, when the relevance is determined based on the similarity only, the same episode is always taken out as a related episode, but in the present invention, the recollection degree changes depending on the history of the key episode being input, and more in the past. The episodes that are pulled out are extracted as useful episodes.

関連エピソードの数、及びキーエピソードの入力履歴の影響は、各時点における想起度の平均値を予め設定された目標平均値に近づけるように制御することで調整される。大きい目標平均値を設定した場合には、各エピソードで想起度が大きくなることが許されることから、閾値を超えるエピソードが増加して多くの関連エピソードが取り出される。また、過去のキーエピソードに関連するエピソードの想起度は、たとえ現在のキーエピソードと関連していなくても、大きい値のままの状態を保つことが許されるためにキーエピソードの入力履歴の影響が大きくなる。一方、目標平均値が小さい場合には、現在のキーエピソードに関連するエピソードのみ想起度が大きくなることが許されるため、閾値を超えるエピソードの数は少なくなり、それまでのキーエピソードの入力履歴の影響も少なくなる。   The number of related episodes and the influence of the input history of key episodes are adjusted by controlling the average recall level at each time point so as to approach a preset target average value. When a large target average value is set, the recall level is allowed to increase in each episode, so episodes exceeding the threshold increase and many related episodes are extracted. In addition, the recall of episodes related to past key episodes is allowed to remain large even if they are not related to the current key episode. growing. On the other hand, if the target average value is small, only the episode related to the current key episode is allowed to be recalled, so the number of episodes exceeding the threshold decreases, and the input history of key episodes up to that point is reduced. The impact is also reduced.

本発明によれば、キーエピソードと直接関連するエピソードのみならず間接的に関連するエピソードも関連エピソードとして取り出すことが可能になる。また、関連エピソードが取り出されてきた過程に応じて、有用なエピソードのみを関連エピソードとして取り出すこと可能になる。さらに、関連エピソードの数を調整すること、及び関連エピソードが取り出されてきた過程が新たな関連エピソードの取り出しに及ぼす影響を調整することが可能になる。   According to the present invention, it is possible to extract not only episodes directly related to key episodes but also indirectly related episodes as related episodes. Further, only useful episodes can be extracted as related episodes according to the process of extracting related episodes. Furthermore, it is possible to adjust the number of related episodes and to adjust the influence of the process in which related episodes have been extracted on the extraction of new related episodes.

以下、本発明の実施形態を図面を参照しつつ詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の想起型情報記憶装置の一実施例の全体的構成図を示すものである。図1において、101は入出力部、102は制御部、103はエピソードデータベース、104は類似度計算部、105は想起度計算部である。実際には、該想起型情報記憶装置はコンピュータにより構成される。   FIG. 1 shows an overall configuration diagram of an embodiment of a recall type information storage apparatus according to the present invention. In FIG. 1, 101 is an input / output unit, 102 is a control unit, 103 is an episode database, 104 is a similarity calculation unit, and 105 is a recall level calculation unit. Actually, the recall type information storage device is constituted by a computer.

入出力部101は、既存情報(エピソード)から関連情報を取り出すためのキーとなる情報(キーエピソード)の入力、関連情報の取り出され方に関するパラメータの入力、新たに既存情報として登録する情報(エピソード)の入力、及び、取り出された関連情報の表示等を行う。制御部102は、情報の入出力動作、その他、装置全体の動作の制御を司る。エピソードデータベース103は、既存情報(エピソード)、その属性情報(メタ情報)及び、当該既存情報を取り出すべきか否かの度合いを表わす想起度を格納している。実施例では、該エピソードデータベース103は、類似度計算部104で計算された既存情報間の類似度も格納し、更には一時的にキー情報と既存情報間の類似度も格納するとする。類似度計算部104は、キーとなる情報(キーエピソード)と既存情報(エピソード)間の類似度、及び、既存情報(エピソード)間の類似度を計算する。想起度計算部105は、エピソードデータベース103の各既存情報(キーエピソード)に付与された、当該既存情報を取り出すべきか否かの度合いを表わす想起度を計算し、時間変化させる。   The input / output unit 101 inputs information (key episode) that is a key for extracting related information from existing information (episode), inputs parameters related to how related information is extracted, and information to be newly registered as existing information (episode ) And display of the extracted related information. The control unit 102 controls input / output operations of information and other operations of the entire apparatus. The episode database 103 stores existing information (episode), attribute information (meta information), and a recall level indicating whether or not the existing information should be extracted. In the embodiment, the episode database 103 stores the similarity between the existing information calculated by the similarity calculation unit 104, and further stores the similarity between the key information and the existing information temporarily. The similarity calculation unit 104 calculates the similarity between key information (key episode) and existing information (episode), and the similarity between existing information (episode). The recall level calculation unit 105 calculates the recall level given to each existing information (key episode) in the episode database 103 and indicating the degree of whether or not the existing information should be extracted, and changes the time.

以下に本実施例の動作概要を説明する。以下の説明では、既存情報をエピソード、エピソードの中から関連するエピソードを取り出すためのキーとなる情報をキーエピソードとする。   The outline of the operation of this embodiment will be described below. In the following description, it is assumed that existing information is an episode, and information serving as a key for extracting a related episode from the episode is a key episode.

図2は、エピソードデータベース103に新たに登録するエピソードが入力された場合の動作概要を示すフローチャートである。ユーザは入出力部101を用いて、新たなエピソードとその想起度の初期値を入力する(ステップ201)。制御部102は、この入力されたエピソードとその想起度の初期値をエピソードデータベース103に新規登録する(ステップ202)。次に、制御部102は、エピソードデータベース103から既存のエピソードを取り出して、新たに入力されたエピソードとともに類似度計算部104に出力し、類似度計算部104にて、エピソードのメタ情報をもとにエピソード間の類似度を計算し、制御部102は、該類似度計算部104からエピソード間の類似度の計算結果を受け取り、それをエピソードデータベース103に登録する(ステップ203)。類似度の計算自体は、本発明の特徴とするところでないので、その詳細は省略する。次に、制御部102は、エピソードデータベース103からエピソードの想起度、エピソード間の類似度を取り出して想起度計算部105に出力し、想起度計算部105にてエピソードの想起度を計算し、制御部102は、想起度計算部105から想起度の計算結果を受け取り、それをエピソードデータベース103に再び登録(更新)する(ステップ204)。この想起度計算部105の処理については後述する。また、想起度計算部105には、入出力部101から入力されたパラメータが、制御部102を介して予め設定されているとする。   FIG. 2 is a flowchart showing an outline of the operation when an episode to be newly registered is input to the episode database 103. The user uses the input / output unit 101 to input a new episode and an initial value of the recall level (step 201). The control unit 102 newly registers the input episode and the initial value of the recall level in the episode database 103 (step 202). Next, the control unit 102 retrieves an existing episode from the episode database 103 and outputs it to the similarity calculation unit 104 together with the newly input episode. The similarity calculation unit 104 uses the meta information of the episode as a basis. The control unit 102 receives the calculation result of the similarity between episodes from the similarity calculation unit 104 and registers it in the episode database 103 (step 203). Since the similarity calculation itself is not a feature of the present invention, its details are omitted. Next, the control unit 102 extracts the recall level of episodes and the similarity between episodes from the episode database 103 and outputs them to the recall level calculation unit 105. The recall level calculation unit 105 calculates the recall level of episodes and performs control. The unit 102 receives the calculation result of the recall level from the recall level calculation unit 105, and registers (updates) it again in the episode database 103 (step 204). The processing of the recall level calculation unit 105 will be described later. Further, it is assumed that parameters input from the input / output unit 101 are set in the recall level calculation unit 105 in advance via the control unit 102.

図3は、キーエピソードが入力された場合の動作概要を示すフローチャートである。ユーザは入出力部101を用いてキーエピソードを入力する(ステップ301)。制御部102は、この入力されたキーエピソードを一時的に保持する。次に、制御部102は、エピソードデータベース103からエピソードを取り出して、入力されたキーエピソードとともに類似度計算部104に出力し、類似度計算部104にて、キーエピソードとエピソード間の類似度を計算し、制御部102は、該類似度計算部104からキーエピソードとエピソード間の類似度の計算結果を受け取り、それをエピソードデータベース103に一時的に登録する(ステップ302)。次に、制御部102は、エピソードデータベース103からエピソードの想起度、エピソード間の類似度、キーエピソードとエピソード間の類似度を取り出して想起度計算部105に出力し、想起度計算部105にてエピソードの想起度を計算し、制御部102は、該想起度計算部105から想起度の計算結果を受け取り、それをエピソードデータベース103に再び登録(更新)する(ステップ303)。次に、制御部102は、エピソードデータベース103を走査して、予め設定された閾値以上の想起度を持つエピソードを読み出し、それらを入出力部101に出力することで、キーエピソードに関連したエピソードをユーザに提示する(ステップ304)。最後に、制御部102は、入力されたキーエピソードをクリアするとともに、次に入力されるキーエピソードとの想起度計算に影響が及ばないように、エピソードデータベース103からキーエピソードとエピソード間の類似度を削除する(ステップ305)。   FIG. 3 is a flowchart illustrating an operation outline when a key episode is input. The user inputs a key episode using the input / output unit 101 (step 301). The control unit 102 temporarily holds the input key episode. Next, the control unit 102 retrieves the episode from the episode database 103 and outputs it to the similarity calculation unit 104 together with the input key episode, and the similarity calculation unit 104 calculates the similarity between the key episode and the episode. Then, the control unit 102 receives the calculation result of the similarity between the key episode and the episode from the similarity calculation unit 104, and temporarily registers it in the episode database 103 (step 302). Next, the control unit 102 retrieves the recall level of the episode, the similarity between episodes, and the similarity between the key episode and the episode from the episode database 103 and outputs them to the recall level calculation unit 105. The degree of recall of the episode is calculated, and the control unit 102 receives the calculation result of the degree of recall from the recall level calculation unit 105 and registers (updates) it again in the episode database 103 (step 303). Next, the control unit 102 scans the episode database 103, reads episodes having a degree of recall equal to or higher than a preset threshold value, and outputs them to the input / output unit 101, so that episodes related to the key episode are retrieved. Present to the user (step 304). Finally, the control unit 102 clears the input key episode, and the similarity between the key episode and the episode from the episode database 103 so as not to affect the recall calculation with the next input key episode. Is deleted (step 305).

次に、想起度計算器105の処理について詳しく説明する。想起度計算器105は、ある時刻tにおけるエピソードiの想起度をxとして、次式に従って想起度を時間変化させる。

Figure 2005070919
ここで、xはエピソードjの想起度、mjiはエピソードiから見たエピソードjの類似度、mijはエピソードjから見たエピソードiの類似度であり、mはエピソードiから見たキーエピソードの類似度である。mji及びmijは一度計算されると、それ以降はエピソードデータベース103に保持される。mはキーエピソードが入力されたときだけ、一時的にエピソードデータベース103に保持され、不要になると削除される(先のステップ305)。また、パラメータcとkの値、及び、kの初期値は、あらかじめユーザが入出力部101を用いて入力し、制御部102により想起度計算部105に保持される。 Next, the process of the recall calculator 105 will be described in detail. The recall level calculator 105 changes the recall level with time according to the following equation, where x i is the recall level of episode i at a certain time t.
Figure 2005070919
Here, x j is recalled degree episode j, m ji similarity episode j viewed from the episode i, m ij is the similarity episode i viewed from the episode j, m i is viewed from episodes i It is the similarity of key episodes. Once m ji and m ij are calculated, they are stored in the episode database 103 thereafter. m j is temporarily stored in the episode database 103 only when a key episode is input, and is deleted when it becomes unnecessary (previous step 305). Further, the values of the parameters c and k 2 and the initial value of k 1 are previously input by the user using the input / output unit 101, and are stored in the recall level calculation unit 105 by the control unit 102.

(1)式における右辺第1項は、エピソードiから見て類似性が高く、かつ大きな想起度を持つエピソードが他に存在する場合、エピソードiの想起度を増加させてキーエピソードと間接的に関連するエピソードも引き出せるように働く。第2項はエピソードiを類似していると見なした他のエピソードが、エピソードiの想起度を減少させて多数のエピソードで想起度が連鎖的に大きくなり過ぎるのを防ぐように働き、kはその効果の強さに関するパラメータ(抑制パラメータ)である。第1項及び第2項は、mji及びmijがそれぞれ正の値を持つエピソード間で計算される。第3項はエピソードiから見て類似するキーエピソードが入力された場合、エピソードiの想起度を増加させるように働く。cはこれらの項による想起度の時間変化の速さに関するパラメータであり、この値が大きいほど、これらの項による想起度の変化が速くなる。第4項は、時間とともにエピソードiの想起度を減少していくように働き、これによりエピソードiと類似するエピソードが存在しない、或いは類似するキーエピソードが入力されない場合には、エピソードiは古い不要なエピソードと見なされて取り出されないようになっていく。kは第4項による想起度の時間変化の速さに関するパラメータであり、この値が大きいほど想起度が速く減少する。実施例では、kをcよりも小さな値に設定することで、他のエピソードやキーエピソードのない場合には徐々に想起度が減少していくようにする。 The first term on the right-hand side of equation (1) is indirectly related to the key episode by increasing the recall level of episode i when there are other similar episodes with a high recall level as seen from episode i. Work to draw related episodes. The second term works to prevent other episodes that have considered episode i similar to reduce the recall of episode i and prevent the recall from becoming too large in many episodes, k 1 is a parameter (suppression parameter) related to the strength of the effect. The first and second terms are calculated between episodes where m ji and m ij each have a positive value. The third term works to increase the recall level of episode i when a similar key episode as viewed from episode i is input. c is a parameter relating to the speed of temporal change of the recall level by these terms, and the larger the value, the faster the change of the recall level by these terms. Item 4 works to reduce the recall of episode i over time, so if there is no episode similar to episode i or no similar key episode is entered, episode i is not needed old It is regarded as a serious episode and is no longer taken out. k 2 is a parameter related to the speed of recall of the time variation of the fourth paragraph recall index larger this value decreases rapidly. In the embodiment, by setting the k 2 to a value smaller than c, gradually recall degree in the absence of other episodes and key episodes so as decreases.

次に、想起度の平均値の制御について説明する。各時刻での想起度の平均値は、(1)式において抑制パラメータkを調整することにより、予め設定された目標平均値(以後、θと表す)に近づけられる。時刻t+1におけるkの値(k[t+1]と表す)は、文献「Kantaris,
N.,Howden,P.F.,The Universal Equation Solver by BASIC,SIGMA PRESS, 1983(三井訳、方程式の数値解法、啓学出版、1987)に掲載されている方法を用いて、次式に従って計算する。

Figure 2005070919
ここで、Nはエピソードの数を表す。 Next, control of the average value of recall will be described. The average value of the recall level at each time is brought close to a preset target average value (hereinafter referred to as θ) by adjusting the suppression parameter k 1 in the equation (1). The value of k 1 at time t + 1 (represented as k 1 [t + 1]) is the document “Kantaris,
N. , Howden, P .; F. , The Universal Equation Solver by BASIC, SIGMA PRESS, 1983 (Mitsui translation, numerical solution of equations, Keigaku Shuppan, 1987).
Figure 2005070919
Here, N represents the number of episodes.

図4は、抑制パラメータkの更新処理の概要を示すフローチャートである。時刻tにおける想起度の平均値からθを引いた値(想起度平均差と呼ぶ)が負で、かつ想起度の平均値の増加率が負の場合、及び、想起度平均差が正で、かつ想起度の平均値の増加率が正の場合、kを更新する(ステップ401、ステップ402がYes、ステップ403がYes)。これらの場合、時刻tにおける想起度平均差の符号が、時刻t−1における想起度平均差の符号と同じであれば、(3)式におけるpを1増やし、θへの収束を加速させる(ステップ404がYes、ステップ405)。逆に、符号が異なる場合にはrを1増やし、θからの発散を防ぐようにする(ステップ404がNo、ステップ406)次に、(3)式に従って、kを更新し(ステップ407)、時刻t+2での更新のために想起度平均差の値を記録しておく(ステップ408)。 Figure 4 is a flowchart showing an outline of update processing for suppressing the parameter k 1. The value obtained by subtracting θ from the average value of recall at time t (referred to as the recall average difference) is negative, and the increase rate of the average recall is negative, and the recall average difference is positive, and the increase rate of the average value of the recall of the case of a positive, updating the k 1 (step 401, step 402 is Yes, step 403 is Yes). In these cases, if the sign of the recall level average difference at time t is the same as the sign of the recall level average difference at time t−1, p in equation (3) is incremented by 1 to accelerate convergence to θ ( Step 404 is Yes, Step 405). Conversely, code increases 1 to r if different, to prevent divergence from the theta (step 404 No, step 406) Then, according to (3), updates the k 1 (step 407) The value of the recall average difference is recorded for update at time t + 2 (step 408).

次に、想起度計算器105での想起度処理の具体例について説明する。図5及び図6は、30×30の格子上に100個の格子点をエピソードとしてランダムに配置し、格子点間の距離をその最大の距離で割った値をエピソード間の類似度として想起度を計算した結果を示すものであり、想起度の値が大きい格子点ほど濃く表示されている。なお、図5は目標平均値θ=0.2と設定した場合、図6はθ=0.4と設定した場合を示している。   Next, a specific example of the recall process in the recall calculator 105 will be described. 5 and 6 show that 100 lattice points are randomly arranged as episodes on a 30 × 30 lattice, and the value obtained by dividing the distance between lattice points by the maximum distance is the degree of recall between episodes. The grid points with the larger recall value are displayed darker. 5 shows a case where the target average value θ = 0.2 is set, and FIG. 6 shows a case where θ = 0.4 is set.

図5及び図6は、時刻t=0において各格子点の想起度がランダムに設定され、時刻t=200において図中Aで示される位置にキーエピソードが入力され、時刻t=400においてAの位置に入力されたキーエピソードが削除され、時刻t=600において図中Bで示される位置にキーエピソードが入力されることを示している。また、(1)式におけるパラメータについては、c=1、k=0.1、及び、kの初期値は0.5に設定されている。t=200において見られるように、θが大きくなると大きな想起度を持つ格子点が多くなる。従って、θの調整によって予め設定された想起度の閾値を超えるエピソード、すなわち関連エピソードの数を調整することが可能である。t=400では、A付近の格子点で想起度が大きくなっており、キーエピソードの入力によって関連するエピソードの想起度が増加することを示している。t=600において想起度の大きさがほとんど変化していないように、キーエピソードが削除された後も、新たなキーエピソードの入力がない限り以前入力されたキーエピソードに関連するエピソードが有用なエピソードとして記憶されている。t=800では、t=600において入力されたキーエピソードによってB付近の格子点で想起度が大きくなっているが、θ=0.4の場合には以前入力したキーエピソードの影響によってA付近の格子点で想起度の変化が少ない。これは、t=400で見られたようにキーエピソードが初めて入力された場合に想起度の高い格子点がA付近のみで円状に存在した様子と異なっており、想起度の計算がキーエピソードの入力履歴に依存することを示している。しかし、θ=0.2の場合にはA付近の格子点の想起度はほとんど小さくなっており、キーエピソードの入力履歴の影響を受けていない。従って、θを調整することにより、キーエピソードの入力履歴の影響を調整することが可能である。 5 and 6, the recall level of each grid point is set at random at time t = 0, a key episode is input at the position indicated by A at time t = 200, and A at time t = 400. The key episode input at the position is deleted, and the key episode is input at the position indicated by B in the figure at time t = 600. For the parameters in the equation (1), c = 1, k 2 = 0.1, and the initial value of k 1 is set to 0.5. As can be seen at t = 200, the larger the θ, the more lattice points with a large recall. Therefore, it is possible to adjust the number of episodes that exceed a preset threshold of recall by adjusting θ, that is, the number of related episodes. At t = 400, the degree of recall is large at the lattice point near A, indicating that the degree of recall of the related episode is increased by the input of the key episode. Even when the key episode is deleted, the episode related to the previously entered key episode is useful as long as there is no new key episode input, so that the degree of recall hardly changes at t = 600. Is remembered as At t = 800, the degree of recall is large at the grid point near B due to the key episode input at t = 600, but when θ = 0.4, the effect of the key episode previously input is near A. There is little change in recall at the grid points. This is different from the situation where a high-recall grid point exists only in the vicinity of A when a key episode is input for the first time as seen at t = 400. It shows that it depends on the input history. However, when θ = 0.2, the recollection degree of the lattice points near A is almost small, and is not influenced by the input history of the key episode. Therefore, by adjusting θ, it is possible to adjust the influence of the input history of the key episode.

図7及び図8は想起度の平均値制御の結果を示したもので、図7はθ=0.2の場合、図8はθ=0.4の場合を示す。また、細線はそれぞれ100個の格子点(エピソード)における想起度の変化を示し、太線はこれら想起度の平均値の変化を示す。図7及び図8は、抑制パラメータkを調整することにより、想起度の平均値を目標設定値に収束させることが可能であることを示している。 7 and 8 show the results of average value control of the recall level. FIG. 7 shows the case of θ = 0.2, and FIG. 8 shows the case of θ = 0.4. Each thin line indicates a change in the recall level at 100 lattice points (episodes), and each thick line indicates a change in the average value of these recall levels. 7 and 8, by adjusting the inhibition parameters k 1, shows that it is possible to converge the average value of the recall of the target setpoint.

以上、本発明の想起型情報記憶装置を一実施例に基づき具体的に説明したが、本発明は上記実施例に限定されるものではなく、時許請求の範囲の趣旨を逸脱しない範囲において種々変更し得ることはいうまでもない。例えば、実施例では、エピソード間の類似度は、一度計算したならエピソードデータベースに保存するとしたが、キーエピソードやエピソードが入力される毎に計算することでもよい。   The recall type information storage device of the present invention has been specifically described based on one embodiment. However, the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the scope of the patent claims. Needless to say, it can be changed. For example, in the embodiment, the similarity between episodes is stored in the episode database once calculated, but may be calculated each time a key episode or episode is input.

本発明の想起型情報記憶装置の一実施例の全体構成を示す図である。It is a figure which shows the whole structure of one Example of the recalling-type information storage device of this invention. 本発明の一実施例のエピソード入力時の動作の概要を示すフローチャートである。It is a flowchart which shows the outline | summary of the operation | movement at the time of the episode input of one Example of this invention. 本発明の一実施例のキーエピソード入力時の動作概要を示すフローチャートである。It is a flowchart which shows the operation | movement outline | summary at the time of the key episode input of one Example of this invention. 想起度の平均制御の動作概要を示すフローチャートである。It is a flowchart which shows the operation | movement outline | summary of the average control of recall. 想起度の処理の具体例(θ=0.2の場合)を示す図である。It is a figure which shows the specific example (in the case of (theta) = 0.2) of the process of recall. 想起度の処理の具体例(θ=0.4の場合)を示す図である。It is a figure which shows the specific example (in the case of (theta) = 0.4) of the process of recall. 想起度の平均値制御の動作例(θ=0.2の場合)を示す図である。It is a figure which shows the operation example (in the case of (theta) = 0.2) of average value control of recall. 想起度の平均値制御の動作例(θ=0.4の場合)を示す図である。It is a figure which shows the operation example (when (theta) = 0.4) of average value control of recall.

符号の説明Explanation of symbols

101 入出力部
102 制御部
103 エピソードデータベース
104 類似度計算部
105 想起度計算部
101 I / O Unit 102 Control Unit 103 Episode Database 104 Similarity Calculation Unit 105 Recall Level Calculation Unit

Claims (5)

既存情報から関連情報を取り出すためのキーとなる情報(以下、キー情報)の入力に応じて、既存情報の中から有用な関連情報を取り出す想起型情報記憶装置であって、
既存情報及び当該既存情報を取り出すべきか否かの度合いを表わす想起度を格納したデータベースと、
関連情報の取り出され方に関するパラメータの入力、キー情報の入力、新たに既存情報として登録する情報の入力、及び、取り出された関連情報の出力を行う入出力手段と、
キー情報と既存情報間の類似度及び既存情報間の類似度を計算する類似度計算手段と、
前記データベースに格納された各既存情報の想起度、前記キー情報と既存情報間の類似度、前記既存情報間の類似度、及び、前記関連情報の取り出され方に関するパラメータを用いて、各既存情報に付与された想起度を計算し、時間変化させる想起度計算手段と、
前記データベースから、予め設定された閾値以上の想起度が付与された既存情報をキー情報の関連情報として取り出す制御手段と、
を具備することを特徴とする想起型情報記憶装置。
A recall type information storage device that extracts useful related information from existing information in response to input of key information (hereinafter, key information) for extracting related information from existing information,
A database storing existing information and a degree of recall indicating whether or not the existing information should be extracted;
Input / output means for inputting parameters relating to how to extract related information, inputting key information, inputting information newly registered as existing information, and outputting extracted related information;
Similarity calculation means for calculating the similarity between key information and existing information and the similarity between existing information;
Each existing information is stored using parameters relating to the recall level of each existing information stored in the database, the similarity between the key information and the existing information, the similarity between the existing information, and how to extract the related information. Recall degree calculation means for calculating the degree of recall given to
From the database, a control means for extracting existing information provided with a recall level equal to or higher than a preset threshold as related information of key information;
A recall type information storage device comprising:
請求項1記載の想起型情報記憶装置において、
前記想起度計算手段は、ある時刻tにおける既存情報iの想起度をxiとして、次式
Figure 2005070919
は時刻tにおける既存情報jの想起度
jiは既存情報iから見た既存情報jの類似度
ijは既存情報jから見た既存情報iの類似度
miは既存情報iから見たキー情報の類似度
c,k,kは関連情報の取り出され方に関するパラメータ
に従って想起度を時間変化させることを特徴とする想起型情報記憶装置。
The recall type information storage device according to claim 1,
The recall level calculation means uses the following formula as the recall level of the existing information i at a certain time t.
Figure 2005070919
x j is the recall of existing information j at time t m ji is the similarity of existing information j viewed from existing information i m ij is the similarity of existing information i viewed from existing information j mi is viewed from existing information i The key information similarity c, k 1 , k 2 is a recall type information storage device characterized in that the recall degree is changed over time according to a parameter relating to how relevant information is extracted.
請求項2記載の想起型情報記憶装置において、
前記(1)式におけるパラメータk2をパラメータcよりも小さな値に設定することを特徴とする想起型情報記憶装置。
The recall type information storage device according to claim 2,
The recall type information storage device, wherein the parameter k2 in the equation (1) is set to a value smaller than the parameter c.
請求項2もしくは3記載の想起型情報記憶装置において、
前記想起度計算手段は、パラメータk1を更新して、各時刻での各既存情報の想起度の平均値が予め設定された目標平均値に近づくように制御することを特徴とする想起型情報記憶装置。
The recall type information storage device according to claim 2 or 3,
The recall level information storage unit is configured to update the parameter k1 so as to control the average value of the recall level of each existing information at each time to approach a preset target average value. apparatus.
請求項4記載の想起型情報記憶装置において、
前記想起度計算手段は、時刻tにおける想起度の平均値から目標平均値を引いた値(以下、想起度平均差)が負で、かつ想起度の平均値の増加率が負の場合、及び、想起度の平均値が正で、かつ想起度の平均値の増加率が正の場合に、パラメータk1を更新することを特徴とする想起型情報記憶装置。
The recall type information storage device according to claim 4,
The recall level calculation means has a negative value (hereinafter referred to as recall level average difference) obtained by subtracting the target average value from the average value of recall level at time t, and the increase rate of the average value of recall level is negative, and The recall type information storage device, wherein the parameter k1 is updated when the average value of the recall level is positive and the increase rate of the average value of the recall level is positive.
JP2003296851A 2003-08-20 2003-08-20 Recall type information storage device Pending JP2005070919A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003296851A JP2005070919A (en) 2003-08-20 2003-08-20 Recall type information storage device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003296851A JP2005070919A (en) 2003-08-20 2003-08-20 Recall type information storage device

Publications (1)

Publication Number Publication Date
JP2005070919A true JP2005070919A (en) 2005-03-17

Family

ID=34402903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003296851A Pending JP2005070919A (en) 2003-08-20 2003-08-20 Recall type information storage device

Country Status (1)

Country Link
JP (1) JP2005070919A (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016102A1 (en) * 2006-08-03 2008-02-07 Nec Corporation Similarity calculation device and information search device

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008016102A1 (en) * 2006-08-03 2008-02-07 Nec Corporation Similarity calculation device and information search device
US8140530B2 (en) 2006-08-03 2012-03-20 Nec Corporation Similarity calculation device and information search device
JP5257071B2 (en) * 2006-08-03 2013-08-07 日本電気株式会社 Similarity calculation device and information retrieval device

Similar Documents

Publication Publication Date Title
JP2940501B2 (en) Document classification apparatus and method
EP2688000A1 (en) Data deduplication method and device
US20160224660A1 (en) Systems and Methods for Distributing Indexer Configurations
JP6070936B2 (en) Information processing apparatus, information processing method, and program
EP3349129B1 (en) Region division method in distributed database, region node and system
JP5652220B2 (en) File management apparatus and program
CN114168608B (en) Data processing system for updating knowledge graph
US11461401B2 (en) Recording medium, response processing method, response processing apparatus, and response processing system
EP3923130B1 (en) Optimizing garbage collection based on survivor lifetime prediction
JP2009251874A (en) Apparatus and method for storing time-series data
CN101639666A (en) Manufacture condition setting system and manufacture condition setting method
Hand What is the purpose of statistical modelling
JP2012174151A (en) File tracking device, file tracking method and file tracking program
JP2005070919A (en) Recall type information storage device
CN113254463A (en) List updating method, system and medium
JP4151288B2 (en) Document management apparatus, document management program, and recording medium
JP2015148982A (en) Operation procedure flow update device, method, and program
JP7585447B1 (en) Diversity concentration device, diversity concentration method, and diversity concentration program
US20220335022A1 (en) Reducing a size of metadata for online deduplication operations
JP5735326B2 (en) IT failure detection / retrieval device and program
US20260050584A1 (en) Unstructured data analytics in traditional data warehouses
US12493596B2 (en) Unstructured data analytics in traditional data warehouses
CN118475925B (en) Asset management program product, asset management device, learning device, asset management system, and asset management method
JP6061164B1 (en) Information processing apparatus, information processing method, and program
JP2005250558A (en) Chained record search device