[go: up one dir, main page]

JP2019066979A - Search device, control method and program therefor, search system, control method and program therefor - Google Patents

Search device, control method and program therefor, search system, control method and program therefor Download PDF

Info

Publication number
JP2019066979A
JP2019066979A JP2017189452A JP2017189452A JP2019066979A JP 2019066979 A JP2019066979 A JP 2019066979A JP 2017189452 A JP2017189452 A JP 2017189452A JP 2017189452 A JP2017189452 A JP 2017189452A JP 2019066979 A JP2019066979 A JP 2019066979A
Authority
JP
Japan
Prior art keywords
search
occurrence
occurrence word
searching
word group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017189452A
Other languages
Japanese (ja)
Other versions
JP2019066979A5 (en
Inventor
下郡山 敬己
Itsuki Shimokooriyama
敬己 下郡山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Marketing Japan Inc
Canon IT Solutions Inc
Original Assignee
Canon Marketing Japan Inc
Canon IT Solutions Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Marketing Japan Inc, Canon IT Solutions Inc filed Critical Canon Marketing Japan Inc
Priority to JP2017189452A priority Critical patent/JP2019066979A/en
Publication of JP2019066979A publication Critical patent/JP2019066979A/en
Publication of JP2019066979A5 publication Critical patent/JP2019066979A5/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

To present further appropriate search conditions, and to enable efficient acquisition of search results that reflect user's intention.SOLUTION: A search device capable of communicating with a storage unit storing search target data accepts a search condition for searching for search target data, searches for the stored data according to the search condition, determines whether or not there is a co-occurrence relation among a plurality of words included in the data obtained by the search, regards a plurality of words having the co-occurrence relation as a co-occurrence word group, accepts a selection of the co-occurrence word group from a plurality of co-occurrence word groups, and executes the search based on the words contained in this co-occurrence word group.SELECTED DRAWING: Figure 7

Description

より適切な検索条件を提示し、ユーザの意図が反映された検索結果を効率的に取得可能とする検索装置、その制御方法、及びプログラム、並びに、検索システム、その制御方法、及びプログラム。   A search device, a control method and a program thereof, and a search system, a control method thereof and a program, capable of presenting more appropriate search conditions and efficiently acquiring a search result reflecting a user's intention.

近年、企業においても家庭においても、パーソナルコンピュータが普及し、またインターネットが身近なものになったこともあって、情報検索を行う機会が多くなっている。また情報検索の技術において、従来から様々な精度向上の手法が検討されている。   In recent years, personal computers have spread in companies and homes, and the Internet has become familiar, and there are many opportunities to search for information. In the information retrieval technology, various methods for improving accuracy have been considered conventionally.

しかしながら、検索精度を向上させても、ユーザが入力するキーワード(検索条件)が不適切であれば、ユーザが意図した検索結果は得られない。ユーザが意図した結果を返すためには、条件として設定する単語の選び方などにかなりの熟練が必要であり、また熟練した人であっても試行錯誤しながら単語を選び直す事が多く、非効率的である。   However, even if the search accuracy is improved, if the keyword (search condition) input by the user is inappropriate, the search result intended by the user can not be obtained. In order to return the result intended by the user, it is necessary to have a great deal of skill in how to select the word to be set as the condition, and even the skilled person often reselects the word through trial and error, which is inefficient It is

特許文献1においては、ユーザが入力した検索条件に対して検索処理を実施すると、対応する検索結果とともに、検索条件に含まれる検索語が当該検索結果を取得するに至った寄与度を表示する。この寄与度は、例えば棒グラフにより視覚化されている。   In Patent Document 1, when the search process is performed on the search condition input by the user, the degree of contribution of the search term included in the search condition to obtain the search result is displayed together with the corresponding search result. The degree of contribution is visualized, for example, by a bar graph.

その棒グラフのサイズを+ボタンで操作することで、寄与度を変更する。寄与度は、検索語の重みを変更するので、検索結果の順位も変更しユーザの意図するものが上位に来る。   Change the degree of contribution by operating the size of the bar graph with the + button. Since the degree of contribution changes the weight of the search term, the order of the search results is also changed, and the user's intention comes to the top.

特開2007−219722号公報JP 2007-219722 A

特許文献1の技術は、検索結果を得た後、ユーザが検索結果を見ながら検索条件とした単語の重みを調整することにより、ユーザの意図する文書がより上位に来るように順位を変更することが可能である。   In the technique of Patent Document 1, after obtaining the search result, the user changes the order so that the document intended by the user comes higher by adjusting the weight of the word used as the search condition while looking at the search result. It is possible.

しかしながら、特許文献1においては、最初の入力条件となった検索語の重要度を変更するだけなので、順位が入れ替わるだけであり、新たな文書が提示されるわけではない。すなわち、ユーザが検索条件を指定する際には気がつかなかった単語を追加し、更にユーザの意図に近い検索条件を作り直して再検索することはできない。さらに、あくまで現在の検索結果として得られている文書の順位を入れ替えるだけであり、最初に検索結果に含まれなかった文書は、いくら調整しても得ることは出来ないという問題がある。   However, in Patent Document 1, since only the importance of the search term that is the first input condition is changed, only the order is changed, and a new document is not presented. That is, it is not possible to add a word that the user did not notice when designating a search condition, and further to create a search condition close to the user's intention and re-search. Furthermore, there is a problem that only the order of the documents obtained as the current search result is replaced, and the document which was not initially included in the search results can not be obtained by adjusting as much.

本発明の目的は、より適切な検索条件を提示し、ユーザの意図が反映された検索結果を効率的に取得可能とするシステムを提供することである。   An object of the present invention is to provide a system that presents more appropriate search conditions and enables efficient acquisition of search results in which the user's intention is reflected.

上記の目的を達成するために、本発明は、記憶部に記憶されたデータを検索対象として検索可能な検索装置であって、前記検索対象のデータを検索するための検索条件を受け付ける受付手段と、前記受付手段で受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索手段と、前記検索手段で検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出手段と、前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付手段と、を備え、さらに、前記検索手段は、前記選択受付手段により受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とする。   In order to achieve the above object, the present invention is a search apparatus capable of searching for data stored in a storage unit as a search target, and receiving means for receiving a search condition for searching for the data to be searched. A search unit for searching for data to be searched stored in the storage unit based on the search condition received by the reception unit; and a co-occurrence relation with a plurality of words included in the data searched by the search unit A co-occurring word extraction unit that uses a plurality of co-occurring words as co-occurring word groups, and a selection acceptance unit that receives selection of co-occurring word groups from the plurality of co-occurring word groups And a search unit that executes a search based on words included in the co-occurrence word group received by the selection receiving unit.

本発明によれば、より適切な検索条件を提示し、ユーザの意図が反映された検索結果を効率的に取得することができる。   According to the present invention, more appropriate search conditions can be presented, and search results reflecting the user's intention can be efficiently acquired.

本発明の実施形態に係る機能構成の一例を示す図である。It is a figure showing an example of the functional composition concerning the embodiment of the present invention. 本発明の実施形態に係る情報処理装置のハードウェア構成の一例を示すブロック図である。It is a block diagram showing an example of the hardware constitutions of the information processor concerning an embodiment of the present invention. 本発明の実施形態に係る検索処理のフローチャートの一例を示す図である。It is a figure showing an example of the flow chart of the search processing concerning the embodiment of the present invention. 本発明の実施形態に係るユーザに新たな条件を指定させ検索に対する新たな指示を受け付ける処理のフローチャートの一例を示す図である。It is a figure which shows an example of the flowchart of the process which accepts the new instruction | indication with respect to the user according to embodiment of this invention, and which designates new conditions and receives the new instruction | indication with respect to a search. 本発明の実施形態に係る検索対象となる文書の一例を示す図である。It is a figure which shows an example of the document used as the search object concerning embodiment of this invention. 本発明の実施形態に係る検索結果の文書と当該文書に含まれる単語を関連づけて記憶する共起語記憶部の一例を説明するための図である。It is a figure for demonstrating an example of the co-occurrence word memory | storage part which links | relates and memorize | stores the document of the search result which concerns on embodiment of this invention, and the word contained in the said document. 本発明の実施形態に係る検索結果を表示し新しい検索条件をユーザに指定するためのユーザインタフェースの一例を示すための図である。It is a figure for showing an example of a user interface for displaying a search result concerning an embodiment of the present invention, and specifying a new search condition to a user. 本発明の実施形態に係る検索結果を表示し新しい検索条件をユーザに指定するためのユーザインタフェースの一例を示すための図である。It is a figure for showing an example of a user interface for displaying a search result concerning an embodiment of the present invention, and specifying a new search condition to a user.

以下、本発明の実施の形態を、図面を参照して詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明の実施形態に係る情報処理装置100(検索装置に相当する)の機能構成の一例を示す図である。   FIG. 1 is a diagram showing an example of a functional configuration of an information processing apparatus 100 (corresponding to a search apparatus) according to an embodiment of the present invention.

検索条件受付部101は、テキスト文書を検索するための検索条件となる入力文字列を受け付ける。当該入力文字列は、本発明の実施形態における情報処理装置がクライアント装置として機能するコンピュータである場合には、当該コンピュータを使用するユーザから直接入力を受け付ける機能部であってもよい。また、当該コンピュータで動作する他のアプリケーションプログラムなどから受け付ける機能部であってもよい。また、本発明の実施形態における情報処理装置がネットワーク上におけるサーバである場合には、他の情報処理装置から当該ネットワークを介して通信情報を受け付ける機能部であってもよい。
文書検索部102は、前述の手順で取得された入力文字列に基づき、文書記憶部121に格納されたテキスト文書を検索する。検索は、テキスト文書自体ではなく、テキスト文書から予め生成された索引に対して実行するものであってもよい。テキスト文書の検索および索引を生成することに関する技術は、周知の技術であるため詳細は割愛する。
The search condition receiving unit 101 receives an input character string as a search condition for searching a text document. When the information processing apparatus according to the embodiment of the present invention is a computer that functions as a client apparatus, the input character string may be a functional unit that receives an input directly from a user who uses the computer. Also, it may be a functional unit accepted from another application program or the like operating on the computer. When the information processing apparatus in the embodiment of the present invention is a server on a network, it may be a functional unit that receives communication information from another information processing apparatus via the network.
The document search unit 102 searches for the text document stored in the document storage unit 121 based on the input character string acquired in the above-described procedure. The search may be performed on an index previously generated from the text document, not the text document itself. The technology relating to text document search and index generation is a well-known technology and will not be described in detail.

共起語抽出部103は、文書検索部102で検索した結果であるテキスト文書から、当該テキスト文書に含まれる文字列を解析し、単語を抽出する。さらに各単語が複数の異なる文書に含まれる状況、逆に異なる単語が同じ文書に含まれる状況に基づき、共起語となる単語のグループを生成する。共起語となる単語のグループは複数存在してもよい。共起語を抽出する方法については周知の技術であるため、本発明の実施形態においては詳細の説明は割愛する。   The co-occurrence word extraction unit 103 analyzes a character string included in the text document, which is a result of the search by the document search unit 102, and extracts a word. Furthermore, based on a situation in which each word is included in a plurality of different documents, and conversely, a situation in which different words are included in the same document, groups of co-occurring words are generated. There may be a plurality of groups of co-occurring words. Since the method of extracting co-occurring words is a well-known technique, the detailed description is omitted in the embodiment of the present invention.

共起語提示部104は、前記共起語抽出部103で抽出した共起語を、共起関係のあるグループ(以下、共起語グループと称す)毎に、ユーザに識別可能に表示する。1つの単語が複数の共起語グループに含まれることもあり得る。例えば図7では、“AI”という単語は、“ディープラーニング”という単語とともに1つの共起語グループを構成しているが、それとは別に“ビッグデータ”という単語とも別の共起語グループを構成している。   The co-occurrence word presentation unit 104 displays the co-occurrence words extracted by the co-occurrence word extraction unit 103 in a distinguishable manner for the user for each group having a co-occurrence relation (hereinafter referred to as a co-occurrence word group). One word may be included in a plurality of co-occurring word groups. For example, in FIG. 7, the word "AI" constitutes one co-occurrence word group together with the word "deep learning", but another co-occurrence word group is also formed as another word "big data" doing.

共起語提示部104で提示された共起語グループは、ユーザにより選択され再検索に使用される。従って、ユーザがいずれの共起語グループを選択したか、また再検索の方法をどのように指示したかを選択共起語受付部105により受け付ける。   The co-occurrence word group presented by the co-occurrence word presentation unit 104 is selected by the user and used for re-search. Therefore, the selected co-occurrence word receiving unit 105 receives which co-occurrence word group the user has selected and how the re-search method is instructed.

図2は、本発明の実施形態に係わる情報処理装置100のハードウェア構成の一例を示すブロック図である。なお、本実施形態では検索装置を含む検索システムを一つの情報処理システムで実現しているが、外部サーバのように複数の記憶部にデータを記憶させ、情報処理装置100がこれらの記憶部に記憶されたデータを検索するようにしても当然構わない。   FIG. 2 is a block diagram showing an example of the hardware configuration of the information processing apparatus 100 according to the embodiment of the present invention. In the present embodiment, a search system including a search device is realized by one information processing system, but data is stored in a plurality of storage units as in an external server, and the information processing apparatus 100 stores the data in these storage units. Naturally, the stored data may be retrieved.

図2に示すように、情報処理装置100は、システムバス204を介してCPU(Central Processing Unit)201、RAM(Random Access Memory)202、ROM(Read Only Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、通信I/Fコントローラ208等が接続された構成を採る。CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。   As shown in FIG. 2, the information processing apparatus 100 includes a central processing unit (CPU) 201, a random access memory (RAM) 202, a read only memory (ROM) 203, an input controller 205, and a video controller 206 via a system bus 204. A memory controller 207, a communication I / F controller 208, and the like are connected. The CPU 201 centrally controls the devices and controllers connected to the system bus 204.

また、ROM203あるいは外部メモリ211(記憶部に相当する)には、CPU201の制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、各サーバあるいは各PCが実行する機能を実現するために必要な後述する各種プログラム等が記憶されている。また、本発明の実施形態を実施するために必要な情報が記憶されている。なお外部メモリはデータベースであってもよい。   In addition, the ROM 203 or the external memory 211 (corresponding to a storage unit) implements a function that is executed by a BIOS (Basic Input / Output System) or an OS (Operating System), which is a control program of the CPU 201, and each server or PC. The various programs etc. which are needed in order to carry out later are stored. Also, information necessary to implement the embodiment of the present invention is stored. The external memory may be a database.

RAM202は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードし、ロードしたプログラムを実行することで各種動作を実現する。   The RAM 202 functions as a main memory, a work area, and the like of the CPU 201. The CPU 201 loads programs necessary for execution of processing from the ROM 203 or the external memory 211 to the RAM 202 and executes the loaded programs to realize various operations.

また、入力コントローラ205は、キーボード(KB)209や不図示のマウス等のポインティングデバイス等からの入力を制御する。   The input controller 205 also controls input from a keyboard (KB) 209 and a pointing device such as a mouse (not shown).

ビデオコントローラ206は、ディスプレイ210等の表示器への表示を制御する。尚、表示器は液晶ディスプレイ等の表示器でもよい。これらは、必要に応じて管理者が使用する。   The video controller 206 controls display on a display such as the display 210. The display may be a display such as a liquid crystal display. These are used by the administrator as needed.

メモリコントローラ207は、ブートプログラム、各種のアプリケーション、フォントデータ、ユーザファイル、編集ファイル、各種データ等を記憶する外部記憶装置(ハードディスク(HD))や、フレキシブルディスク(FD)、あるいは、PCMCIA(Personal Computer Memory Card International Association)カードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。   The memory controller 207 is an external storage device (hard disk (HD)) for storing a boot program, various applications, font data, user files, editing files, various data, etc., a flexible disk (FD), or PCMCIA (Personal Computer). Memory Card International Association) Control access to an external memory 211 such as a Compact Flash (registered trademark) memory connected via an adapter to a card slot.

通信I/Fコントローラ208は、ネットワークを介して外部機器と接続・通信し、ネットワークでの通信制御処理を実行する。例えば、TCP/IP(Transmission Control Protocol/Internet Protocol)を用いた通信等が可能である。   The communication I / F controller 208 connects to and communicates with external devices via a network, and executes communication control processing in the network. For example, communication using TCP / IP (Transmission Control Protocol / Internet Protocol) is possible.

尚、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上に表示することが可能である。また、CPU201は、ディスプレイ210上のマウスカーソル(図示しない)等によるユーザ指示を可能とする。   The CPU 201 can display the image on the display 210 by executing, for example, an outline font rasterization process on a display information area in the RAM 202. Further, the CPU 201 enables user instruction by a mouse cursor (not shown) or the like on the display 210.

本発明を実現するための後述する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。   Various programs to be described later for realizing the present invention are stored in the external memory 211, and are executed by the CPU 201 by being loaded into the RAM 202 as necessary.

図3は、本発明の実施形態に係る検索処理のフローチャートの一例を示す図である。図3のフローチャートの各ステップは、情報処理装置100上のCPU201で実行される。   FIG. 3 is a diagram showing an example of a flowchart of search processing according to the embodiment of the present invention. Each step of the flowchart in FIG. 3 is executed by the CPU 201 on the information processing apparatus 100.

ステップS301においては、検索条件受付部101が、文書検索部102でテキスト文書を検索するための条件として、文字列(検索条件に相当する)を受け付ける(受付手段に相当する)。本発明の実施形態の説明のための例として、“人工知能、機械学習”という検索条件(文字列)が受け付けられたとする。   In step S301, the search condition receiving unit 101 receives a character string (corresponding to a search condition) as a condition for searching the text document by the document search unit 102 (corresponding to a receiving unit). As an example for describing the embodiment of the present invention, it is assumed that a search condition (character string) "artificial intelligence, machine learning" is accepted.

ステップS302においては、文書検索部102が、前述の文字列を検索条件として、文書記憶部121から条件に合致するテキスト文書の一覧を取得する(検索手段に相当する)。文書記憶部121の例を、図5を用いて説明する。   In step S302, the document search unit 102 acquires a list of text documents matching the condition from the document storage unit 121 using the above-described character string as a search condition (corresponding to a search unit). An example of the document storage unit 121 will be described with reference to FIG.

図5において、501が1つの検索対象となる文書である。図5の例では、テキスト文書は501a〜501nまである。これらの文書501のうち、前述の検索条件“人工知能”、“機械学習”の両方またはいずれかを含む文書が検索結果となるが、図5の例では、501a〜501eの5つである。検索条件と一致した単語を太字にし、またアンダーラインを引いている。例えば、文書501aでは、“機械学習”の1つが一致している。本実施形態では、文書501をテキスト文書として説明するが、検索対象は画像データ形式の文書であってもよいものとする。   In FIG. 5, reference numeral 501 denotes a document to be searched. In the example of FIG. 5, the text documents are up to 501a to 501n. Among the documents 501, documents including both or any of the above-described search conditions “artificial intelligence” and “machine learning” are search results. In the example of FIG. 5, there are five documents 501a to 501e. The words that match the search conditions are bolded and underlined. For example, in the document 501a, one of "machine learning" matches. In the present embodiment, the document 501 is described as a text document, but the search target may be a document in the image data format.

さらに共起語については後述するが、共起語となった単語には、アンダーラインを引いている。   Further, although co-occurring words will be described later, underlines are drawn for the words that become co-occurring words.

ステップS303においては、共起語抽出部103が、検索結果である前述の文書(前述の例では501a〜501e)を解析し、当該テキスト文書のいずれかに含まれる単語のうち、共起語となるものすなわち、共起関係があるものを判定することで、共起関係にある複数の単語を抽出する。(共起語抽出手段に相当する)   In step S303, co-occurring word extraction unit 103 analyzes the above-mentioned document (501a to 501e in the above-mentioned example) which is the search result, and co-occurring word among the words included in any of the text documents. By determining the co-occurrence relationship, multiple words having a co-occurrence relationship are extracted. (Corresponds to co-occurrence word extraction means)

本例では、異なる2つ以上の文書(501)で、同時に現れた単語を説明の便宜上共起語としている。例えば“AI”と“ディープラーニング”は、501a、501cで2回一緒に出現しているので共起語と見なす。一方、501aにおいては、“言葉”、“メディア”という2単語が共起しているが、これらは他の検索結果に含まれる文書(501b〜501e)では共起していないため、共起語とはみなしていない。   In this example, words appearing simultaneously in two or more different documents (501) are used as co-occurring words for the sake of explanation. For example, “AI” and “deep learning” are regarded as co-occurring words because they appear together twice in 501 a and 501 c. On the other hand, in 501a, two words "word" and "media" co-occur, but they do not co-occur in documents (501b-501e) included in other search results, so co-occurring words Not considered.

なお、異なる2つ以上の文書で、同時に現れた単語を共起語としているのはあくまで説明の便宜上のものであって、周知の技術である共起語抽出において、他の方法(他の基準)に基づき共起語を決定しても良いことはいうまでもない。   Note that using two or more different documents and simultaneously appearing words as co-occurring words is for convenience of explanation only, and other methods (other criteria in co-occurring word extraction that is a well-known technique) It goes without saying that co-occurring words may be determined based on.

ここで共起語抽出部103によって抽出された単語(共起語)が、共起語記憶部311に記憶されている状態を図6によって説明する。   The state in which the word (co-occurrence word) extracted by the co-occurrence word extraction unit 103 is stored in the co-occurrence word storage unit 311 will be described with reference to FIG.

図6においては共起語記憶部311を、共起語として抽出された単語一覧601と共起語を含んでいる文書一覧602の表としている。この表はあくまで説明の便宜上のものであり、その他の構成であっても本発明の範囲に含まれる。   In FIG. 6, the co-occurrence word storage unit 311 is a table of a word list 601 extracted as a co-occurrence word and a document list 602 including the co-occurrence word. This table is for convenience of illustration only, and other configurations are included in the scope of the present invention.

番号が付与されている欄、例えば文書501aと単語“AI”が交差している欄には“1”と記載されているが、これは共起語グループの“1番”に所属する単語“AI”が文書501aに含まれていることを示す。文書501aには“1番”として“ディープラーニング”という単語が指定されているため、この2単語が共起語となる。さらに共起語グループ“1番”は、文書501cにも含まれている。   Although "1" is described in the column where the number is given, for example, the column where the document 501a and the word "AI" intersect, this is a word that belongs to "No. 1" of the co-occurrence word group. "AI" is included in the document 501a. Since the word "deep learning" is designated as "first" in the document 501a, these two words become co-occurrence words. The co-occurring word group “No. 1” is also included in the document 501 c.

また、前述した通り文書501aに含まれる単語“言葉”、“メディア”など“△”のマークがついているものは、単語としては出現したが共起語とはなっていないものを表している。説明上記載したが、これら共起語とはなっていない単語は、共起語記憶部311に含まれていなくとも良い。   Further, as described above, the words “word”, “media” and the like with the mark “Δ” included in the document 501 a indicate the words that appeared but not co-occurring words. Although described on the explanation, these words that are not co-occurring words may not be included in the co-occurring word storage unit 311.

さらに文書501bの“AI”の欄に“○”が記載されている。これは“AI”という単語は、文書501bの中では共起語ではないが、他の文書において共起語となっている、ということを示している。   Furthermore, "o" is described in the "AI" column of the document 501b. This indicates that the word "AI" is not a co-occurring word in the document 501b, but a co-occurring word in other documents.

ステップS304においては、文書を検索した結果を表示するとともに、共起語提示部104は、ユーザが選択可能な方法で、共起語抽出部103が抽出した共起語グループを表示する(表示制御手段に相当する)。ただし、そもそも共起語がない場合には、検索結果の文書一覧だけが表示される。   In step S304, the document search result is displayed, and the co-occurrence word presentation unit 104 displays the co-occurrence word group extracted by the co-occurrence word extraction unit 103 by a method selectable by the user (display control Equivalent to means). However, if there are no co-occurring words in the first place, only the document list of the search results is displayed.

まずここで表示される画面について図7を用いて説明する。検索結果一覧表示画面(700)は、左側画面(701)が周知の検索システムの画面を表している。すなわち、701は、検索条件の入力欄(703)、当該入力欄(703)を条件として検索を指示するためのボタン(704)、検索結果の文書一覧を表示する部分(706)から構成されている。検索条件の入力欄(703)には例として“人工知能”、“機械学習”が入力されており、検索ボタン(704)を押下した結果として、文書記憶部121に対する検索結果の5つの文書の見出しが表示されている(706)。ユーザが706の一覧から特定の文書を指定すると、指定された文書内の詳細が画面として表示される。この画面(図8)については、図4のフローチャートの処理において詳細に説明する。   First, the screen displayed here will be described with reference to FIG. In the search result list display screen (700), the left side screen (701) represents a screen of a known search system. That is, 701 includes a search condition input field (703), a button (704) for instructing a search based on the input field (703), and a portion (706) for displaying a document list of search results. There is. For example, "artificial intelligence" and "machine learning" are input in the search condition input field (703), and as a result of pressing the search button (704), five documents of search results for the document storage unit 121 are displayed. A heading is displayed (706). When the user designates a specific document from the list of 706, the details in the designated document are displayed as a screen. This screen (FIG. 8) will be described in detail in the process of the flowchart of FIG.

共起語グループの一覧を表示し、ユーザの再検索の操作を受け付けるインタフェースである。   This is an interface that displays a list of co-occurring word groups and receives the user's re-search operation.

本実施例においては、図6で示した通り、丸番号の1〜3で指定された共起語のグループ3個が抽出されているので、そのグループに応じて、702内に3つの共起語グループ705a、705b、705cが表示されている。この図の例では、例えば枠が太い線になっている705bをユーザが選択したとする。本例では、1つだけ選択しているが、複数選択しても良い。   In the present embodiment, as shown in FIG. 6, since three groups of co-occurring words designated by 1 to 3 of the circle numbers are extracted, three co-occurrences in 702 are made according to the groups. Word groups 705a, 705b, 705c are displayed. In the example of this figure, for example, it is assumed that the user selects 705b whose frame is a thick line. In this example, only one is selected, but a plurality may be selected.

なお、ここで共起語のグループは“同一の文書に含まれている傾向が強い”単語の組み合わせであるため、それらの文書に関連する傾向を表していることになる。特に、ユーザが入力した検索条件が必ずしも適切ではないことがある。例えば、ユーザがある単語を思いつき、あるいは特定の傾向を持つ文書の内容とのつながりを意識していない場合がある。しかしながら、共起語をグループとして提示することでユーザは当初は気づいていない傾向に気づくことが可能となる効果が得られる。   Here, since a group of co-occurring words is a combination of words that are “probably in the same document”, it indicates a tendency associated with those documents. In particular, the search conditions entered by the user may not always be appropriate. For example, the user may think of a certain word, or may not be aware of the connection with the content of a document having a specific tendency. However, presenting co-occurring words as a group has an effect of enabling the user to notice a tendency that he / she is not aware at first.

例えば、705a、705bは当初入力した検索条件に対して、技術的な関連性を持つ傾向があることが予想される。一方で、705cは、ビジネス上の関連性を持つ傾向があることが予想される。従って、共起語のグループ毎に識別可能に表示することによって、ユーザは再検索する際に、自分自身が何を知りたいのかを詳しく分析して条件となるキーワードを選択することが可能となる、すなわち検索の“意図”を明確に指示することが可能となるという効果を得ることが出来る。   For example, it is expected that 705a and 705b tend to have technical relevance to the initially input search condition. On the other hand, 705c is expected to tend to have business relevance. Therefore, by displaying identifiably for each group of co-occurring words, the user can analyze in detail what he / she wants to know and select a keyword as a condition when re-searching. That is, it is possible to obtain an effect that it is possible to clearly indicate the "intention" of the search.

再検索で使用する共起語のグループを指定した後、ユーザは追加検索ボタン707または新規検索ボタン708のいずれのボタンを押下する。これにより再検索時の検索条件を指示する。追加検索ボタン707を押下した場合には、当初の検索条件を残したまま、この画面で選択した共起語グループの単語も条件に追加し、再検索を実行する(第1検索方法に相当する)。一方で、新規検索ボタン708を押下した場合には、当初の検索条件をクリアして、この画面で選択した共起語グループの単語だけを条件として、再検索を実行する(第2検索方法に相当する)。検索方法はこれに限定されず、他の検索方法を更に設けるようにしても構わない。   After designating the group of co-occurrence words to be used in the re-search, the user presses either the additional search button 707 or the new search button 708. This indicates the search condition at the time of the re-search. When the additional search button 707 is pressed, the word of the co-occurrence word group selected on this screen is also added to the condition while the original search condition remains, and the re-search is executed (corresponding to the first search method) ). On the other hand, when the new search button 708 is pressed, the original search condition is cleared, and the re-search is executed on the condition of only the word of the co-occurrence word group selected on this screen (the second search method). Equivalent to). The search method is not limited to this, and another search method may be further provided.

ここでは、ユーザによる共起語の選択処理が完了したとして、図3のフローチャートの説明に戻る。   Here, assuming that the co-occurrence word selection process by the user is completed, the description returns to the flowchart of FIG. 3.

ステップS305においては、ステップS303でそもそも共起語が抽出されたか否かを判定する。具体的には、図6で説明した共起語記憶部311において、共起語グループ(丸付きの数字)が存在するか否かを判定する。共起語が抽出されている場合(YESの場合)には、ステップS306に進む。共起語が抽出されていない場合(NOの場合)には、図3のフローチャートは終了し、1回の検索に対する処理は完了する。   In step S305, it is determined in step S303 whether co-occurring words have been extracted in the first place. Specifically, in the co-occurring word storage unit 311 described with reference to FIG. 6, it is determined whether or not there is a co-occurring word group (circled numbers). If the co-occurrence word is extracted (in the case of YES), the process proceeds to step S306. If the co-occurring word is not extracted (in the case of NO), the flowchart of FIG. 3 ends, and the processing for one search is completed.

ステップS306においては、ユーザにより選択された共起語の状態を返すが、その処理については図4のフローチャートで詳述する。   In step S306, the state of the co-occurrence word selected by the user is returned, and the process will be described in detail with reference to the flowchart of FIG.

ステップS307においては、ステップS306が返した状態によって分岐する。ユーザが共起語を選択していない場合(NOの場合)には、検索は当初ステップS301で受け付けた検索条件で検索した(ステップS302)状態で完了することになる。   In step S307, the process branches depending on the state returned in step S306. When the user has not selected the co-occurrence word (in the case of NO), the search is completed in the state of being searched based on the search condition initially received in step S301 (step S302).

ステップS306においてユーザが共起語を選択した場合(YESの場合)には、検索は当初ステップS301で受け付けた検索条件とは変更される。そのためステップS302にもどり再検索を行う。以降、前述の処理を繰り返すことになる。   When the user selects the co-occurrence word in step S306 (in the case of YES), the search is changed from the search condition initially received in step S301. Therefore, the process returns to step S302 to perform a re-search. Thereafter, the above-described processing is repeated.

これで図3のフローチャートによる処理の説明を完了する。次にステップ306の詳細の処理を説明する図4のフローチャートの処理を説明する。   This completes the description of the process according to the flowchart of FIG. Next, the process of the flowchart of FIG. 4 will be described for explaining the process of step 306 in detail.

図4は、本発明の実施形態に係るユーザに新たな条件を指定させ検索に対する新たな指示を受け付ける処理のフローチャートの一例を示す図である。図4のフローチャートの各ステップは、情報処理装置100上のCPU201で実行される。   FIG. 4 is a diagram showing an example of a flowchart of a process of causing a user to designate a new condition according to an embodiment of the present invention and accepting a new instruction for a search. Each step of the flowchart in FIG. 4 is executed by the CPU 201 on the information processing apparatus 100.

なお、図4のフローチャートを処理する時点では、図3のステップS304により、検索結果および共起語があればその情報がユーザに提示されている。その画面については前述図3のステップS304において詳細に説明をしている。   At the time of processing the flowchart of FIG. 4, if the search result and the co-occurring word are present, the information is presented to the user at step S304 of FIG. The screen is described in detail in step S304 of FIG. 3 described above.

ステップS401においては、表示画面として検索結果の文書の一覧を表示する(図7)か、一覧表示(図7)の中からユーザの操作指示により特定の文書内容の詳細を表示する(図8)か、を判定する。ユーザが特定の文書を選択せず、一覧表示(図7)のままの場合(NOの場合)にはステップS403に進む。ユーザが特定の文書を指定して文書内の情報を詳細表示する操作を行った場合(YESの場合)は、その操作を受け付け、ステップS402に進む。   In step S401, a list of documents as a search result is displayed as a display screen (FIG. 7), or details of specific document contents are displayed according to the user's operation instruction from the list display (FIG. 7) (FIG. 8). To determine. If the user does not select a specific document and displays the list (FIG. 7) (in the case of NO), the process proceeds to step S403. If the user designates a specific document and performs an operation to display the information in the document in detail (in the case of YES), the operation is accepted, and the process proceeds to step S402.

ステップS402においては、ユーザに指定された特定の文書の詳細を表示し、ユーザからの操作を受け付ける。この画面例は、図8にて既に詳しく説明している。図8は、本発明の実施形態に係る検索結果を表示し新しい検索条件をユーザに指定するためのユーザインタフェースの一例を示すための図である。   In step S402, details of a specific document designated by the user are displayed, and an operation from the user is accepted. This screen example has already been described in detail in FIG. FIG. 8 is a view for showing an example of a user interface for displaying a search result and designating a new search condition to a user according to the embodiment of the present invention.

800aはユーザにより選択された特定の文書の内容を詳細に表示する画面である。図7においては、個々の文書の詳細までをユーザは確認できず、共起語のグループの中からユーザの意図を反映していると思われるものを選択することが出来た。800aではさらに、文書の詳細内容まで確認した上で、ユーザの意図している情報であるかを判断した上で、指定の共起語を検索条件に追加すれば良いかどうかを検討するという効果を得ることが可能となる。   A screen 800a displays the contents of the specific document selected by the user in detail. In FIG. 7, the user can not confirm the details of the individual documents, and can select a group of co-occurring words which seems to reflect the user's intention. In 800a, after confirming the detailed contents of the document, it is determined whether the information is intended by the user, and then it is considered whether or not the designated co-occurrence word should be added to the search condition. It is possible to obtain

この例では、文書501dが表示されている。文書501dには、2つの共起語グループ、705bと705cが含まれている。共起語グループをわかりやすくするために、例えば800aでは、共起語グループ705bは点線で囲み(801)、共起語グループ705cは実線で囲む(802)などとしてもよい。線の種別はあくまで例であって、色、フォントなどの表示形式を用いる他、共起語グループを識別可能にするものであればいずれの方式でもよいことは言うまでもない。   In this example, a document 501 d is displayed. The document 501d includes two co-occurrence word groups 705b and 705c. In order to make the co-occurrence word group intelligible, for example, in 800 a, the co-occurrence word group 705 b may be surrounded by a dotted line (801), and the co-occurrence word group 705 c may be surrounded by a solid line (802). It goes without saying that the type of line is merely an example, and any display format such as color and font may be used, as long as the co-occurrence word group can be identified.

この画面の中で、再検索の際に条件としたい共起語の文字列をマウスでクリックする、などの方法で指定する。1つの単語を指定すると、その単語だけが選択できてもよいし、または同じグループの共起語が全て選択できるようにしてもよい。さらに複数の単語、複数の共起語グループを選択可能としてもよい。   In this screen, specify the character string of the co-occurring word you want to make a condition for re-search by clicking with the mouse, etc. When one word is designated, only that word may be selected, or all co-occurring words in the same group may be selected. Furthermore, a plurality of words and a plurality of co-occurrence word groups may be selectable.

検索したら例えば803のメニューから追加検索をするか、新規検索をするかを指定する。803は、あらかじめ画面(800a)上に配置されていてもよいし、あるいは単語を選択した後にマウスを右クリックするなどの操作でポップアップメニューが表示されてもよい。この操作の選択方法はあくまで設計事項であって、いかなる方式であっても両者の区別がつくのであればよいことはいうまでもない。   After the search, for example, it is specified whether an additional search or a new search is to be performed from the menu 803. 803 may be arranged in advance on the screen (800a), or a pop-up menu may be displayed by an operation such as right-clicking the mouse after selecting a word. It is needless to say that the selection method of this operation is a design matter to the last, and any method can be used as long as the both can be distinguished.

次に800bについて説明する。800aの例では表示されている文書(501d)は共起語が全て含まれているものであった。しかしながら800bの文書(501b)では、例として“AI”という単語は含まれており、またこの“AI”は他の文書では共起語グループの構成要素となっている(図6の丸番号1)。   Next, 800b will be described. In the example of 800a, the displayed document (501d) contains all co-occurring words. However, in the document (501b) of 800b, the word "AI" is included as an example, and this "AI" is a component of the co-occurrence word group in other documents (circle number 1 in FIG. 6). ).

そこで、この“AI”という単語が他の文書ではあるが共起語を構成するものであることをユーザに明示しているのが805である。このようにユーザに明示することで、当該文書501bには含まれないが、共起語グループとして検索条件に使用するか否かをユーザが判断し、使用するようにシステムが受け付けることができるようにしても良い。   Therefore, it is clearly shown to the user that the word "AI" is another document but constitutes a co-occurrence word. By clearly indicating to the user as described above, the system can receive the user to determine whether or not to use as a co-occurrence word group as a co-occurrence word group although it is not included in the document 501 b. You may

以上で、詳細画面での共起語グループ選択について説明した。なお、ここでは1つの文書の詳細を表示してその中だけで共起語グループを選択したが、ユーザの求めると思われる複数の文書を繰り返し詳細表示しながら、それぞれの画面で共起語グループを選択しても良い。   The co-occurrence word group selection on the detail screen has been described above. Although the details of one document are displayed here and the co-occurrence word group is selected only in that, the co-occurrence word group is displayed on each screen while repeatedly displaying details of a plurality of documents that the user seems to request You may choose

これにより文書の実際の内容を確認しながら、共起語グループはユーザが欲しい情報を検索するための意図として有用なものであるか否かを判断するこという効果を得ることが可能となる。   As a result, while confirming the actual content of the document, it is possible to obtain an effect of determining whether the co-occurrence word group is useful as an intention for searching for information desired by the user.

以上で、ユーザが文書の詳細表示の画面から共起語グループを選択する操作の説明を完了し、図4のフローチャートの説明に話を戻す。   This completes the explanation of the operation for the user to select the co-occurrence word group from the screen of the document detail display, and the description returns to the explanation of the flowchart in FIG.

ステップS403においては、図7の画面またはステップS402(および図8の画面)で説明した共起語グループの選択状況を受け付ける。選択状況の受付には“共起語グループを選択していない”あるいは“共起語グループを選択せず図8の詳細画面で単語だけを選択した”という状況も含めるものとする。   In step S403, the co-occurrence word group selection situation described in the screen of FIG. 7 or step S402 (and the screen of FIG. 8) is accepted. It is assumed that the reception of the selection status includes the situation that “co-occurrence word group is not selected” or “only co-occurrence word group is not selected and only words are selected on the detail screen of FIG. 8”.

ステップS404においては、ユーザによって共起語グループあるいは単語が選択されたか否かを判定する(選択受付手段に相当する)。共起語グループあるいは単語が選択されていない場合(NOの場合)は、共起語の受付は終了し図4のフローチャートの処理を完了する。図3に戻り、ステップS307でNOの場合として処理される。共起語グループあるいは単語が選択されている場合(YESの場合)は、ステップS405に進む。   In step S404, it is determined whether the co-occurrence word group or the word is selected by the user (corresponding to selection accepting means). When the co-occurrence word group or the word is not selected (in the case of NO), the acceptance of the co-occurrence word is finished, and the processing of the flowchart of FIG. 4 is completed. Returning to FIG. 3, the process is performed as NO in step S307. If the co-occurrence word group or the word is selected (in the case of YES), the process proceeds to step S405.

ステップS405においては、さらにユーザが指定した再検索の実行方法を受け付ける。ユーザが検索結果一覧画面(図7)において、追加検索ボタン707または新規検索ボタン708を選択した場合、あるいは文書の詳細表示(図8)において、追加検索ボタンまたは新規検索ボタンを押下することによって、追加検索か新規検索かの指示を受け付ける。   In step S405, the method of executing the re-search designated by the user is further received. When the user selects the additional search button 707 or the new search button 708 in the search result list screen (FIG. 7) or by pressing the additional search button or the new search button in the document detail display (FIG. 8), Accept an indication of additional search or new search.

ステップS406においては、ステップS405で受け付けたユーザからの指示が追加検索か新規検索かを判定する。   In step S406, it is determined whether the instruction from the user accepted in step S405 is an additional search or a new search.

新規検索であると判定された場合にはステップS407に進み、ステップS301で受け付けていた検索条件を削除し、ステップS403で受け付けた共起語グループあるいは単語を新たに検索条件として設定する。   If it is determined that the search is a new search, the process proceeds to step S407, the search condition received in step S301 is deleted, and the co-occurrence word group or word received in step S403 is newly set as a search condition.

追加検索であると判定された場合にはステップS408に進み、ステップS301で受け付けていた検索条件をせず、ステップS403で受け付けた共起語グループあるいは単語を検索条件として追加設定する。   If it is determined that the search is an additional search, the process proceeds to step S408, and the co-occurrence word group or word received in step S403 is additionally set as a search condition without setting the search condition received in step S301.

以上で図4のフローチャートの処理の説明を完了する。   This is the end of the description of the process of the flowchart of FIG.

以上、本発明によれば、より適切な検索条件を提示し、ユーザの意図が反映された検索結果を効率的に取得することができる。   As described above, according to the present invention, it is possible to present more appropriate search conditions and efficiently acquire search results in which the user's intention is reflected.

なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。   The configuration of the various data described above and the contents thereof are not limited to this, and it is needless to say that they are configured in various configurations and contents depending on the application and purpose.

以上、いくつかの実施形態について示したが、本発明は、例えば、システム、装置、方法、コンピュータプログラムもしくは記録媒体等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。   Although some embodiments have been described above, the present invention can be embodied as, for example, a system, an apparatus, a method, a computer program or a recording medium, and more specifically, a plurality of devices. The present invention may be applied to a system constituted by the above, or may be applied to an apparatus consisting of one device.

また、本発明の実施形態におけるコンピュータプログラムは、図3〜図4に示すフローチャートの処理方法をコンピュータが実行可能なコンピュータプログラムであり、本発明のの実施形態記憶媒体は図3〜図4の処理方法をコンピュータが実行可能なコンピュータプログラムが記憶されている。なお、本発明の実施形態におけるコンピュータプログラムは図3〜図4の各装置の処理方法ごとのコンピュータプログラムであってもよい。   Further, the computer program in the embodiment of the present invention is a computer program capable of executing the processing method of the flowcharts shown in FIGS. 3 to 4 by the computer, and the storage medium of the embodiment of the present invention is the processing of FIG. A computer program is stored that is executable by the computer. The computer program in the embodiment of the present invention may be a computer program for each processing method of each device shown in FIGS.

以上のように、前述した実施形態の機能を実現するコンピュータプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたコンピュータプログラムを読出し実行することによっても、本発明の目的が達成されることは言うまでもない。   As described above, a recording medium recording a computer program for realizing the functions of the above-described embodiments is supplied to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus is stored in the recording medium. It goes without saying that the object of the present invention can also be achieved by reading and executing a program.

この場合、記録媒体から読み出されたコンピュータプログラム自体が本発明の新規な機能を実現することになり、そのコンピュータプログラムを記憶した記録媒体は本発明を構成することになる。   In this case, the computer program itself read out from the recording medium realizes the novel functions of the present invention, and the recording medium storing the computer program constitutes the present invention.

コンピュータプログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク、ソリッドステートドライブ等を用いることができる。   As a recording medium for supplying a computer program, for example, a flexible disk, a hard disk, an optical disk, a magneto-optical disk, a CD-ROM, a CD-R, a DVD-ROM, a magnetic tape, a non-volatile memory card, a ROM, an EEPROM, Silicon disks, solid state drives, etc. can be used.

また、コンピュータが読み出したコンピュータプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのコンピュータプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Further, by executing the computer program read by the computer, not only the functions of the above-described embodiment are realized, but also an operating system (OS) or the like operating on the computer based on the instructions of the computer program. It goes without saying that a part or all of the actual processing is performed, and the processing realizes the functions of the above-described embodiments.

さらに、記録媒体から読み出されたコンピュータプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのコンピュータプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。   Furthermore, after the computer program read from the recording medium is written to a memory provided to a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function is executed based on the instruction of the computer program code. It goes without saying that the case where the CPU or the like provided in the expansion board or the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiment are realized by the processing.

また、本発明は、複数の機器から構成されるシステムに適用しても、1つの機器からなる装置に適用してもよい。また、本発明は、システムあるいは装置にコンピュータプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのコンピュータプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。   Further, the present invention may be applied to a system constituted by a plurality of devices or to an apparatus comprising a single device. It goes without saying that the present invention is also applicable to the case where it is achieved by supplying a computer program to a system or apparatus. In this case, by reading a recording medium storing a computer program for achieving the present invention into the system or apparatus, the system or apparatus can receive the effects of the present invention.

さらに、本発明を達成するためのコンピュータプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。   Furthermore, by downloading and reading out a computer program for achieving the present invention from a server on a network, a database or the like by a communication program, the system or apparatus can receive the effects of the present invention.

なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。   In addition, the structure which combined each embodiment mentioned above and its modification is also contained in this invention altogether.

100 情報処理装置
101 検索条件受付部
102 文書検索部
103 共起語抽出部
104 共起語提示部
105 選択共起語受付部
121 文書記憶部
311 共起語記憶部

100 information processing apparatus 101 search condition reception unit 102 document search unit 103 co-occurrence word extraction unit 104 co-occurrence word presentation unit 105 selection co-occurrence word reception unit 121 document storage unit 311 co-occurrence word storage unit

Claims (10)

記憶部に記憶されたデータを検索対象として検索可能な検索装置であって、
前記検索対象のデータを検索するための検索条件を受け付ける受付手段と、
前記受付手段で受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索手段と、
前記検索手段で検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出手段と、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付手段と、を備え、
さらに、前記検索手段は、前記選択受付手段により受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とする検索装置。
A search device capable of searching for data stored in a storage unit as a search target,
A receiving unit for receiving a search condition for searching for the search target data;
Search means for searching for search target data stored in the storage unit based on the search condition received by the reception means;
Co-occurrence word extraction means for judging whether or not there is a co-occurrence relation between a plurality of words included in the data searched by the search means, and making a plurality of words having a co-occurrence relation as a co-occurrence word group;
A selection accepting unit that accepts selection of a co-occurrence word group from the plurality of co-occurrence word groups;
Furthermore, the search unit executes a search based on a word included in the co-occurrence word group received by the selection reception unit.
前記検索手段で検索されたデータに含まれる単語であって、共起関係がある複数の前記単語からなる共起語グループを表示するよう制御する表示制御手段
を特徴とする請求項1に記載の検索装置。
A display control means for controlling to display a co-occurrence word group consisting of a plurality of the words contained in the data searched by the search means and having a co-occurrence relation, according to claim 1. Search device.
前記表示制御手段は、前記検索手段で検索された前記記憶部に記憶されるデータを表示する際に、前記共起語グループに含まれる単語と、前記共起語グループに含まれない単語とを識別可能に表示するよう制御すること
を特徴とする請求項2に記載の検索装置
The display control means, when displaying the data stored in the storage unit searched by the search means, a word included in the co-occurrence word group and a word not included in the co-occurrence word group The search apparatus according to claim 2, characterized in that control is performed to display in a discriminable manner.
前記表示制御手段は、前記選択受付手段で選択を受け付けた共起語グループの単語を表示するよう制御すること
を特徴とする請求項2または3に記載の検索装置。
The search device according to claim 2 or 3, wherein the display control means controls to display the words of the co-occurrence word group whose selection is accepted by the selection acceptance means.
前記共起語グループに含まれる単語と前記検索条件とに基づいて前記記憶部に記憶されたデータを検索する第1検索方法と、前記共起語グループに含まれる前記単語に基づいて検索する第2検索方法とを少なくとも含む、検索方法の指定を受け付ける検索方法受付手段を更に備え、
前記検索手段は、前記検索方法受付手段で前記第1検索方法の指定を受け付けた場合には前記共起語グループに含まれる単語と前記検索条件とに基づいて前記記憶部に記憶されたデータを検索し、前記検索方法受付手段で前記第2検索方法の指定を受け付けた場合には前記共起語グループに含まれる単語に基づいて検索すること
を特徴とする請求項1乃至4のいずれか1項に記載の検索装置。
A first search method for searching data stored in the storage unit based on words included in the co-occurrence word group and the search condition; and searching based on the words included in the co-occurrence word group 2. A search method accepting means for receiving specification of a search method including at least two search methods, further comprising:
When the search method reception means receives the specification of the first search method, the search means stores data stored in the storage unit on the basis of a word included in the co-occurrence word group and the search condition. 5. The search method receiving unit according to any one of claims 1 to 4, wherein, when the search method receiving unit receives the specification of the second search method, the search is performed based on a word included in the co-occurrence word group. The search device described in the section.
記憶部に記憶されたデータを検索対象として検索可能な検索装置の制御方法であって、
前記検索対象のデータを検索するための検索条件を受け付ける受付ステップと、
前記受付ステップで受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索ステップと、
前記検索ステップで検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出ステップと、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付ステップと、を備え、
さらに、前記検索ステップは、前記選択受付ステップにより受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とする検索装置の制御方法。
A control method of a search device capable of searching for data stored in a storage unit as a search target,
A receiving step of receiving a search condition for searching for the search target data;
A search step of searching for search target data stored in the storage unit based on the search condition received in the reception step;
Determining whether or not there is a co-occurrence relation between a plurality of words included in the data searched in the search step, and co-occurring word extraction step in which a plurality of words having a co-occurrence relation are a co-occurrence word group;
A selection receiving step of receiving selection of a co-occurrence word group from the plurality of co-occurrence word groups;
Furthermore, in the control method of the search apparatus, the search step executes a search based on a word included in the co-occurrence word group received by the selection receiving step.
記憶部に記憶されたデータを検索対象として検索可能な検索装置で実行可能なプログラムであって、
前記検索装置を、
前記検索対象のデータを検索するための検索条件を受け付ける受付手段と、
前記受付手段で受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索手段と、
前記検索手段で検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出手段と、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付手段として機能させ、
さらに、前記検索手段は、前記選択受付手段により受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とするプログラム。
A program that can be executed by a search device capable of searching for data stored in a storage unit as a search target,
The search device
A receiving unit for receiving a search condition for searching for the search target data;
Search means for searching for search target data stored in the storage unit based on the search condition received by the reception means;
Co-occurrence word extraction means for judging whether or not there is a co-occurrence relation between a plurality of words included in the data searched by the search means, and making a plurality of words having a co-occurrence relation as a co-occurrence word group;
Function as selection accepting means for accepting selection of co-occurrence word groups from the plurality of co-occurrence word groups,
Furthermore, the program is characterized in that the search means executes a search based on words included in the co-occurrence word group accepted by the selection acceptance means.
記憶部に記憶されたデータを検索対象として検索可能な検索装置を含む検索システムであって、
前記検索対象のデータを検索するための検索条件を受け付ける受付手段と、
前記受付手段で受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索手段と、
前記検索手段で検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出手段と、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付手段と、を備え、
さらに、前記検索手段は、前記選択受付手段により受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とする検索システム。
A search system including a search device capable of searching for data stored in a storage unit as a search target,
A receiving unit for receiving a search condition for searching for the search target data;
Search means for searching for search target data stored in the storage unit based on the search condition received by the reception means;
Co-occurrence word extraction means for judging whether or not there is a co-occurrence relation between a plurality of words included in the data searched by the search means, and making a plurality of words having a co-occurrence relation as a co-occurrence word group;
A selection accepting unit that accepts selection of a co-occurrence word group from the plurality of co-occurrence word groups;
Furthermore, the search system executes a search based on a word included in the co-occurrence word group accepted by the selection accepting means.
記憶部に記憶されたデータを検索対象として検索可能な検索装置を含む検索システムの制御方法であって、
前記検索対象のデータを検索するための検索条件を受け付ける受付ステップと、
前記受付ステップで受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索ステップと、
前記検索ステップで検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出ステップと、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付ステップと、を備え、
さらに、前記検索ステップは、前記選択受付ステップにより受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とする検索システムの制御方法。
A control method of a search system including a search device capable of searching for data stored in a storage unit as a search target,
A receiving step of receiving a search condition for searching for the search target data;
A search step of searching for search target data stored in the storage unit based on the search condition received in the reception step;
Determining whether or not there is a co-occurrence relation between a plurality of words included in the data searched in the search step, and co-occurring word extraction step in which a plurality of words having a co-occurrence relation are a co-occurrence word group;
A selection receiving step of receiving selection of a co-occurrence word group from the plurality of co-occurrence word groups;
Furthermore, in the control method of the search system, the search step executes a search based on a word included in the co-occurrence word group received by the selection receiving step.
記憶部に記憶されたデータを検索対象として検索可能な検索装置を含む検索システムで実行可能なプログラムであって、
前記検索システムを、
前記検索対象のデータを検索するための検索条件を受け付ける受付手段と、
前記受付手段で受け付けた前記検索条件に基づいて、前記記憶部に記憶された検索対象のデータを検索する検索手段と、
前記検索手段で検索されたデータに含まれる複数の単語に共起関係があるか否かを判定し、共起関係がある複数の単語を共起語グループとする共起語抽出手段と、
前記複数の共起語グループから、共起語グループの選択を受け付ける選択受付手段として機能させ、
さらに、前記検索手段は、前記選択受付手段により受け付けた前記共起語グループに含まれる単語に基づいて検索を実行することを特徴とするプログラム。

A program executable by a search system including a search device capable of searching for data stored in a storage unit as a search target,
The search system
A receiving unit for receiving a search condition for searching for the search target data;
Search means for searching for search target data stored in the storage unit based on the search condition received by the reception means;
Co-occurrence word extraction means for judging whether or not there is a co-occurrence relation between a plurality of words included in the data searched by the search means, and making a plurality of words having a co-occurrence relation as a co-occurrence word group;
Function as selection accepting means for accepting selection of co-occurrence word groups from the plurality of co-occurrence word groups,
Furthermore, the program is characterized in that the search means executes a search based on words included in the co-occurrence word group accepted by the selection acceptance means.

JP2017189452A 2017-09-29 2017-09-29 Search device, control method and program therefor, search system, control method and program therefor Pending JP2019066979A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017189452A JP2019066979A (en) 2017-09-29 2017-09-29 Search device, control method and program therefor, search system, control method and program therefor

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017189452A JP2019066979A (en) 2017-09-29 2017-09-29 Search device, control method and program therefor, search system, control method and program therefor

Publications (2)

Publication Number Publication Date
JP2019066979A true JP2019066979A (en) 2019-04-25
JP2019066979A5 JP2019066979A5 (en) 2020-11-12

Family

ID=66339590

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017189452A Pending JP2019066979A (en) 2017-09-29 2017-09-29 Search device, control method and program therefor, search system, control method and program therefor

Country Status (1)

Country Link
JP (1) JP2019066979A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2021210210A1 (en) * 2020-04-15 2021-10-21
JP2021529385A (en) * 2018-06-25 2021-10-28 セールスフォース ドット コム インコーポレイティッド Systems and methods for investigating relationships between entities
JP2023522601A (en) * 2020-04-21 2023-05-31 インターナショナル・ビジネス・マシーンズ・コーポレーション Dynamic generation of facets using graph partitioning
JPWO2024089859A1 (en) * 2022-10-27 2024-05-02

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09218881A (en) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> Additional search word candidate presentation method, document search method and devices thereof
JP2002183194A (en) * 2000-12-15 2002-06-28 Ricoh Co Ltd Search expression generating apparatus and method
JP2005084879A (en) * 2003-09-08 2005-03-31 Canon Software Inc Information processor, information processing method, program, and recording media
JP2007310663A (en) * 2006-05-18 2007-11-29 Nec Corp Information retrieval support system, information retrieval support method, and information retrieval support program
JP2010009251A (en) * 2008-06-25 2010-01-14 Internatl Business Mach Corp <Ibm> Apparatus and method for supporting document data search
US20100191747A1 (en) * 2009-01-29 2010-07-29 Hyungsuk Ji Method and apparatus for providing related words for queries using word co-occurrence frequency
JP2012123654A (en) * 2010-12-09 2012-06-28 Nippon Telegr & Teleph Corp <Ntt> Information retrieval device, information retrieval method and information retrieval program

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09218881A (en) * 1996-02-09 1997-08-19 Nippon Telegr & Teleph Corp <Ntt> Additional search word candidate presentation method, document search method and devices thereof
JP2002183194A (en) * 2000-12-15 2002-06-28 Ricoh Co Ltd Search expression generating apparatus and method
JP2005084879A (en) * 2003-09-08 2005-03-31 Canon Software Inc Information processor, information processing method, program, and recording media
JP2007310663A (en) * 2006-05-18 2007-11-29 Nec Corp Information retrieval support system, information retrieval support method, and information retrieval support program
JP2010009251A (en) * 2008-06-25 2010-01-14 Internatl Business Mach Corp <Ibm> Apparatus and method for supporting document data search
US20100191747A1 (en) * 2009-01-29 2010-07-29 Hyungsuk Ji Method and apparatus for providing related words for queries using word co-occurrence frequency
JP2012123654A (en) * 2010-12-09 2012-06-28 Nippon Telegr & Teleph Corp <Ntt> Information retrieval device, information retrieval method and information retrieval program

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2021529385A (en) * 2018-06-25 2021-10-28 セールスフォース ドット コム インコーポレイティッド Systems and methods for investigating relationships between entities
JP7503000B2 (en) 2018-06-25 2024-06-19 セールスフォース インコーポレイテッド System and method for investigating relationships between entities - Patents.com
US12265587B2 (en) 2018-06-25 2025-04-01 Salesforce, Inc. Systems and method for investigating relationships among entities
JPWO2021210210A1 (en) * 2020-04-15 2021-10-21
JP7589737B2 (en) 2020-04-15 2024-11-26 株式会社島津製作所 Document search device, document search system, and document search method
JP2023522601A (en) * 2020-04-21 2023-05-31 インターナショナル・ビジネス・マシーンズ・コーポレーション Dynamic generation of facets using graph partitioning
JP7643813B2 (en) 2020-04-21 2025-03-11 インターナショナル・ビジネス・マシーンズ・コーポレーション Dynamic Generation of Facets Using Graph Partitioning
JPWO2024089859A1 (en) * 2022-10-27 2024-05-02

Similar Documents

Publication Publication Date Title
US7769771B2 (en) Searching a document using relevance feedback
CA2644111C (en) Method and system for displaying search results
KR101292632B1 (en) Method of recommending content, method of creating recommendation information, computer-readable medium storing content recommendation program, content recommendation server, and content-providing system
US20120136848A1 (en) Information processing apparatus capable of providing advanced text search
US20080275850A1 (en) Image tag designating apparatus, image search apparatus, methods of controlling operation of same, and programs for controlling computers of same
JP2001052033A (en) Device and method for managing url
JP5645614B2 (en) Document management apparatus, document management apparatus control method, and computer program
JP2019066979A (en) Search device, control method and program therefor, search system, control method and program therefor
US20170103111A1 (en) Systems and methods for multi-dimensional computer-aided searching
JP2013101532A (en) Project management device, project management method, program, and storage medium
JP2022006178A (en) Processing method, device, and electronic device of deep model visualization data
JP4839813B2 (en) Information processing system and program
JP7340952B2 (en) Template search system and template search method
JP7078837B2 (en) Information processing system, information processing device, its control method and program
JP2021107953A (en) Information processing apparatus, information processing system, method for controlling the same, and program
JP2006185020A (en) Information processor, information processing method and computer program
JP5880637B2 (en) Information processing apparatus, control method and program thereof, and information processing system, control method and program thereof
JP7273293B2 (en) Information processing device, control method, program
JP2019101591A (en) Information processing device, control method, and program
KR101153534B1 (en) Method and system for automatically tagging web data and local data
JP3967230B2 (en) Image information display system
JP6867579B2 (en) Information processing equipment, information processing system, its control method and program
JP2018036855A (en) Information processing system, control method of information processing system, and program
JP5617535B2 (en) Information processing apparatus, information processing apparatus processing method, and program.
JP7453505B2 (en) Information processing system, its control method and program

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20180703

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20181031

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20190115

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20200929

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20200929

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20210917

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211102

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20220524