JP2025115724A - Information processing device, control method, and program - Google Patents
Information processing device, control method, and programInfo
- Publication number
- JP2025115724A JP2025115724A JP2024010330A JP2024010330A JP2025115724A JP 2025115724 A JP2025115724 A JP 2025115724A JP 2024010330 A JP2024010330 A JP 2024010330A JP 2024010330 A JP2024010330 A JP 2024010330A JP 2025115724 A JP2025115724 A JP 2025115724A
- Authority
- JP
- Japan
- Prior art keywords
- document
- search
- information associated
- processing device
- changes
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
【課題】本発明は、検索対象文書集合と検索DBを分けた検索システムにおいて、ユーザが検索結果に対して行った編集内容を保持することが可能となる仕組みを提供することを目的とする。
【解決手段】本発明は、文書管理元から収集した文書に対応付く、当該文書に付随する情報を登録する登録手段と、前記文書に付随する情報に対する変更内容を当該文書に対応付けて記録する記録手段と、前記文書に付随する情報が再び登録された場合に、前記記録した変更内容に基づいて、前記文書に付随する情報を更新する更新手段と、を備えることを特徴とする情報処理装置。
【選択図】図1
The present invention aims to provide a mechanism that enables a user to retain edits made to search results in a search system in which the set of documents to be searched and the search DB are separated.
[Solution] The present invention is an information processing device characterized by comprising: a registration means for registering information accompanying a document that corresponds to the document collected from a document management source; a recording means for recording changes to the information accompanying the document in association with the document; and an update means for updating the information accompanying the document based on the recorded changes when the information accompanying the document is registered again.
[Selected Figure] Figure 1
Description
文書データを検索する技術に関する。 Related to technology for searching document data.
企業内に電子化された文書が増えるにつれ、業務上必要な文書を効率的に検索するための文書検索システムの重要性が高まっている。ここで、文書検索システムは、ユーザが入力した検索条件に関連する文書集合をユーザに提示するものである。 As the number of digitized documents within companies increases, the importance of document search systems for efficiently searching for documents necessary for business purposes is growing. A document search system presents users with a collection of documents related to the search criteria they enter.
検索で発見したい対象となる文書の集合が、検索機能が付加された文書管理システムで管理されている場合もある一方で、検索機能の無いシステムで管理する場合や、様々な管理形態下にある複数の文書集合を横断的に検索したい場合などもある。一般に、このような場合には、クローラなどのプログラムを用いて、文書集合からその内容や文書へのリンクなどを別のDB(検索DB)へ格納し、このDBへの検索を以て文書を発見するという構成が採られることが多い。これにより、文書集合と文書検索システムは疎結合となり、文書を管理する方法に関わらず検索が可能となる。 While the collection of documents you want to find through a search may be managed by a document management system with search functionality, it may also be managed by a system without search functionality, or you may want to search across multiple document collections managed in various ways. In such cases, a program such as a crawler is typically used to store the contents and links to documents from the document collection in a separate database (search database), and documents are then found by searching this database. This loosely couples the document collection and the document search system, making searches possible regardless of how the documents are managed.
ここで、文書検索システムには、表示された検索結果をユーザが編集したいというニーズがある。代表的な具体例としては、文書の内容に関するタグを編集したいときである。 In document search systems, there is a need for users to edit the search results displayed. A typical example is when users want to edit tags related to the document content.
特許文献1には、前述したような文書集合と検索DBを分けた構成の文書検索システムに於いて、文書内容から特徴語を抽出して文書に付与する方法が記載されている。このような実施形態の場合に検索結果を編集するニーズは大きくなる。プログラムにより自動付与された特徴語やタグ(カテゴリ)が間違っていたり不足していたりする場合、ユーザは、この検索結果を編集して正しいタグを付与する必要がある。 Patent Document 1 describes a method for extracting feature words from document content and assigning them to documents in a document search system configured as described above, with a separate document collection and search database. In such an implementation, there is a greater need to edit search results. If the feature words or tags (categories) automatically assigned by the program are incorrect or missing, the user must edit the search results and assign the correct tags.
特許文献2には、入力文書から抽出された特徴語をタグの候補として提示し、ユーザに選択させることにより、入力文書の話題に対応するタグとして登録する方法が記載されている。 Patent document 2 describes a method in which feature words extracted from an input document are presented as tag candidates and the user is allowed to select one, thereby registering them as tags corresponding to the topic of the input document.
ユーザによる編集内容を保持する方法として、文書またはそのメタデータを直接書き換えることが考えられる。これは、検索機能付き文書管理システムで一般に採られる手法である。しかし、文書集合と検索DBが分かれている構成の文書検索システムでは、以下の理由によってこの手法は採用し難い。すなわち、文書集合は検索システムとは別の場所にあるため、管理上の問題や処理の煩雑さなどにより書き換えることができない場合がある。加えて、前述のようにクローラにより初めてタグが付与される構成であれば、タグは文書集合には格納されておらず、編集対象が存在しない。 One way to preserve edits made by users is to directly rewrite the document or its metadata. This is a method commonly used in document management systems with search functions. However, in document search systems where the document collection and search database are separate, this method is difficult to adopt for the following reasons. Namely, because the document collection is located in a different location from the search system, it may not be possible to rewrite it due to management issues or complex processing. In addition, if tags are assigned for the first time by the crawler, as mentioned above, the tags are not stored in the document collection, and there is nothing to edit.
特許文献2では、タグの選択結果を文書のメタデータとして登録することを想定しており、上記の通り、文書集合と検索DBが分かれている構成の文書検索システムでは特許文献2の方法を採用することができない。 Patent Document 2 assumes that the tag selection results will be registered as document metadata, and as mentioned above, the method of Patent Document 2 cannot be adopted in document search systems that have a separate document collection and search database.
別の方法として、編集内容を検索DBに保持することも考えられる。しかし、文書が再度クロールされた場合に、クローラによって、検索DB内の当該レコードは上書きされてしまう。従って、ユーザによる編集が永続化しないという問題がある。 An alternative approach would be to store edits in the search database. However, if the document is crawled again, the crawler will overwrite the record in the search database. This poses the problem that user edits are not permanent.
そのため、検索対象文書集合と検索DBを分けた検索システムの実施形態に於いて、ユーザによる編集内容を、文書やそのメタデータへの書き込みを行わずして、永続的に保持することが望まれる。 For this reason, in an embodiment of a search system in which the set of documents to be searched and the search DB are separated, it is desirable to permanently retain edits made by the user without writing them to the document or its metadata.
そこで、本発明は、検索対象文書集合と検索DBを分けた検索システムにおいて、ユーザが検索結果に対して行った編集内容を保持することが可能となる仕組みを提供することを目的とする。 The present invention aims to provide a mechanism that allows users to retain edits made to search results in a search system that separates the set of documents to be searched from the search database.
本発明は、文書管理元から収集した文書に対応付く、当該文書に付随する情報を登録する登録手段と、前記文書に付随する情報に対する変更内容を当該文書に対応付けて記録する記録手段と、前記文書に付随する情報が再び登録された場合に、前記記録した変更内容に基づいて、前記文書に付随する情報を更新する更新手段と、を備えることを特徴とする情報処理装置。 The present invention relates to an information processing device comprising: a registration means for registering information associated with a document collected from a document management source, the information being associated with the document; a recording means for recording changes to the information associated with the document in association with the document; and an update means for updating the information associated with the document based on the recorded changes when the information associated with the document is re-registered.
本発明によれば、検索対象文書集合と検索DBを分けた検索システムにおいて、ユーザが検索結果に対して行った編集内容を保持することが可能となる。 According to the present invention, in a search system in which the set of documents to be searched and the search database are separated, it is possible to retain edits made by the user to the search results.
以下、図面を参照して、本発明の実施形態を詳細に説明する。 Embodiments of the present invention will be described in detail below with reference to the drawings.
図1は、本発明の実施形態における文書検索システムのシステム構成の一例を示す図である。 Figure 1 shows an example of the system configuration of a document search system according to an embodiment of the present invention.
文書検索システム100は、差分DB120、検索DB130、文書登録装置140、文書編集装置150、文書検索装置160から成る。また、文書検索システム100の外部には、文書DB110とクライアント端末があり、それぞれが文書検索システム100と接続されている。 The document search system 100 consists of a differential DB 120, a search DB 130, a document registration device 140, a document editing device 150, and a document search device 160. Also, external to the document search system 100 are a document DB 110 and a client terminal, each of which is connected to the document search system 100.
文書DB110は、検索対象となる文書の集合が格納されているDBである。これは、検索で発見したい、検索結果のソースとなる文書そのものを格納したものでも良いし、その文書から作成した検索インデックスなどの二次的なデータ集合でも良い。 Document DB 110 is a DB that stores a collection of documents to be searched. This may be the documents themselves that are the source of search results that you want to find through a search, or it may be a secondary data collection such as a search index created from those documents.
差分DB120は、検索結果に対してユーザが行った編集内容を格納するDBである。詳細は図3で後述する。 The difference DB 120 is a DB that stores edits made by users to search results. Details will be explained later in Figure 3.
検索DB130は、文書DB110から登録対象の文書に係る情報を収集し、検索に適した形式に変換した内容を格納するDBである。 Search DB 130 is a DB that collects information related to documents to be registered from document DB 110 and stores the content converted into a format suitable for searching.
図4は検索DB130の一例である。検索DB130は、文書を一意に識別するための文書ID131、文書の内容を示すコンテンツ132から成る。コンテンツ132は、項目133と値134のペアから成る。例えば、検索DB130のレコード135によれば、文書IDが文書1の文書には、「本発明の実施形態は…である。」という本文と、作成者が「小栗 虫太郎」であること、タグとして「特許文献」「検索システム」「同義語」「社員共通」の4つ、リンク「http://example.com/tokko.pdf」にアクセスすれば文書へアクセスできることが示されている。尚、例として前述の4項目を記載しているが、文書のタイトルなど検索システムとして利用する項目を追加で備えても良いし、作成者など利用しない項目を備えなくても良い。 Figure 4 shows an example of search DB 130. Search DB 130 consists of a document ID 131 for uniquely identifying a document and content 132 indicating the document's contents. Content 132 consists of pairs of items 133 and values 134. For example, according to record 135 in search DB 130, a document with document ID Document 1 contains the text "An embodiment of the present invention is...", the creator is "Mushitaro Oguri", there are four tags - "Patent Document," "Search System," "Synonym," and "Common to All Employees," and the document can be accessed by accessing the link "http://example.com/tokko.pdf." Note that while the four items mentioned above are listed as an example, additional items used by the search system, such as the document title, may be included, and items not used, such as the creator, may not be included.
図1に戻って、文書登録装置140は、文書DB110に格納された文書を検索DB130に登録するための装置であり、文書受信部141、文書変換部142、文書差分統合部143、文書登録処理部144から成る。 Returning to Figure 1, the document registration device 140 is a device for registering documents stored in the document DB 110 in the search DB 130, and is composed of a document receiving unit 141, a document conversion unit 142, a document difference integration unit 143, and a document registration processing unit 144.
文書受信部141は、文書DB110から登録対象の文書を受け付けるための装置である。クローラやWebブラウザのアドオン等は、文書DB110内の任意の文書を収集して文書受信部141に送信できる。あるいは、ユーザがクライアント端末のWebブラウザなどを通じて、人手で文書DB110から送信するような構成をとってもよい。 The document receiving unit 141 is a device for accepting documents to be registered from the document DB 110. A crawler, a web browser add-on, or the like can collect any document in the document DB 110 and send it to the document receiving unit 141. Alternatively, a user may manually send documents from the document DB 110 via a web browser on a client terminal, for example.
文書変換部142は、文書受信部141が受け付けた文書を、検索DB130に格納できるような検索に適した形式に変換するための装置である。ここで、公知の技術を用いて内容に関するタグ付けを自動で行うなどの工夫を施したカラム操作が行われても良い。 The document conversion unit 142 is a device that converts documents received by the document reception unit 141 into a format suitable for searching so that they can be stored in the search DB 130. Here, column operations that incorporate techniques such as automatic content tagging using known technology may be performed.
文書差分統合部143は、文書変換部142で変換された文書の各項目に対して、ユーザの編集内容を反映するための装置である。処理の詳細は図6にて後述する。 The document difference integration unit 143 is a device that reflects the user's edits to each item in the document converted by the document conversion unit 142. Details of this processing will be described later with reference to Figure 6.
文書登録処理部144は、文書差分統合部143でユーザの編集内容を反映して検索に適した形式になった文書を、検索DB130に登録するための装置である。 The document registration processing unit 144 is a device that registers documents that have been converted into a format suitable for searching by reflecting the user's edits in the document difference integration unit 143 in the search DB 130.
文書編集装置150は、編集内容受信部151、編集内容登録処理部152、編集内容反映処理部153から成る。 The document editing device 150 consists of an edited content receiving unit 151, an edited content registration processing unit 152, and an edited content reflection processing unit 153.
編集内容受信部151は、ユーザが検索結果に対して行った編集内容を受け付けるための装置である。ユーザは、クライアント端末のWebブラウザなどを通じて、後述する文書検索装置160によって提示された検索結果を編集して、その内容を編集内容受信部151に送信できる。ここで、クライアント端末が送信した編集内容が、差分DB120に登録するのに適したような、検索DBからの差分の形式(図3で後述)になっていなければ、適当な変換を行っても良い。 The edited content receiving unit 151 is a device for accepting edits made by the user to the search results. The user can edit the search results presented by the document search device 160 (described later) through a web browser on the client terminal or the like, and send the edited content to the edited content receiving unit 151. If the edited content sent by the client terminal is not in a format suitable for registering in the difference DB 120, such as a difference format from the search DB (described later in Figure 3), then an appropriate conversion may be performed.
編集内容登録処理部152は、編集内容受信部151が受け付けた編集内容を、差分DB120に登録するための装置である。 The edited content registration processing unit 152 is a device for registering edited content received by the edited content receiving unit 151 in the difference DB 120.
編集内容反映処理部153は、編集内容受信部151が受け付けた編集内容を、検索DB130に反映するための装置である。検索DB130への編集内容の反映は、文書差分統合部143での処理と同じく、図6で後述する。 The edited content reflection processing unit 153 is a device for reflecting the edited content received by the edited content receiving unit 151 in the search DB 130. Reflecting the edited content in the search DB 130 is the same as the processing performed by the document difference integration unit 143, and will be described later with reference to Figure 6.
文書検索装置160は、ユーザからの検索リクエストを受け付け、検索DB130からリクエストに応じたレコードを検索し、ユーザに返すための装置である。効率的な検索処理を実現するためには、文書登録処理部144にて、公知の技術である転置インデックスを作成して検索DB130に格納し、検索時に用いれば良い。 The document search device 160 is a device that accepts search requests from users, searches the search DB 130 for records that correspond to the requests, and returns them to the user. To achieve efficient search processing, the document registration processing unit 144 can create an inverted index, which is a well-known technique, store it in the search DB 130, and use it during searches.
図2は、本発明の実施形態におけるクライアント端末、文書検索システム100のハードウェア構成の一例を示すブロック図である。 Figure 2 is a block diagram showing an example of the hardware configuration of a client terminal and document search system 100 in an embodiment of the present invention.
図2に示すように、情報処理装置は、システムバス204を介してCPU(Central Processing Unit)201、ROM(Read Only Memory)202、RAM(Random Access Memory)203、入力コントローラ205、ビデオコントローラ206、メモリコントローラ207、よび通信I/Fコントローラ208が接続される。 As shown in FIG. 2, the information processing device is connected to a CPU (Central Processing Unit) 201, a ROM (Read Only Memory) 202, a RAM (Random Access Memory) 203, an input controller 205, a video controller 206, a memory controller 207, and a communication I/F controller 208 via a system bus 204.
CPU201は、システムバス204に接続される各デバイスやコントローラを統括的に制御する。 The CPU 201 provides overall control over the devices and controllers connected to the system bus 204.
ROM202あるいは外部メモリ211は、CPU201が実行する制御プログラムであるBIOS(Basic Input/Output System)やOS(Operating System)や、本情報処理方法を実現するためのコンピュータ読み取り実行可能なプログラムおよび必要な各種データ(データテーブルを含む)を保持している。 The ROM 202 or external memory 211 stores the BIOS (Basic Input/Output System) and OS (Operating System), which are control programs executed by the CPU 201, as well as computer-readable and executable programs and various necessary data (including data tables) for implementing this information processing method.
RAM203は、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM202あるいは外部メモリ211からRAM203にロードし、ロードしたプログラムを実行することで各種動作を実現する。 RAM 203 functions as the CPU 201's main memory, work area, etc. The CPU 201 loads programs and other data required for processing from ROM 202 or external memory 211 into RAM 203, and executes the loaded programs to perform various operations.
入力コントローラ205は、キーボード209や不図示のマウス等のポインティングデバイス等の入力装置からの入力を制御する。入力装置がタッチパネルの場合、ユーザがタッチパネルに表示されたアイコンやカーソルやボタンに合わせて押下(指等でタッチ)することにより、各種の指示を行うことができることとする。 The input controller 205 controls input from input devices such as a keyboard 209 and a pointing device such as a mouse (not shown). If the input device is a touch panel, the user can issue various instructions by pressing (touching with a finger, etc.) icons, cursors, or buttons displayed on the touch panel.
また、タッチパネルは、マルチタッチスクリーンなどの、複数の指でタッチされた位置を検出することが可能なタッチパネルであってもよい。 The touch panel may also be a touch panel capable of detecting positions touched by multiple fingers, such as a multi-touch screen.
ビデオコントローラ206は、ディスプレイ210などの外部出力装置への表示を制御する。ディスプレイは本体と一体になったノート型パソコンのディスプレイも含まれるものとする。なお、外部出力装置はディスプレイに限ったものははく、例えばプロジェクタであってもよい。また、前述のタッチ操作を受け付け可能な装置については、入力装置も提供する。 Video controller 206 controls the display on external output devices such as display 210. This includes displays on notebook computers that are integrated into the main body. Note that external output devices are not limited to displays, and may be, for example, projectors. For devices capable of accepting touch operations, an input device is also provided.
なおビデオコントローラ206は、表示制御を行うためのビデオメモリ(VRAM)を制御することが可能で、ビデオメモリ領域としてRAM203の一部を利用することもできるし、別途専用のビデオメモリを設けることも可能である。 The video controller 206 can control the video memory (VRAM) used for display control, and can use part of the RAM 203 as the video memory area, or it can provide a separate dedicated video memory.
メモリコントローラ207は、外部メモリ211へのアクセスを制御する。外部メモリとしては、ブートプログラム、各種アプリケーション、フォントデータ、ユーザファイル、編集ファイル、および各種データ等を記憶する外部記憶装置(ハードディスク)、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等を利用可能である。 The memory controller 207 controls access to the external memory 211. The external memory can be an external storage device (hard disk) that stores boot programs, various applications, font data, user files, edited files, and various data, a flexible disk (FD), or a CompactFlash (registered trademark) memory connected to a PCMCIA card slot via an adapter.
通信I/Fコントローラ208は、ネットワークを介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信やISDNなどの電話回線、および携帯電話の3G回線を用いた通信が可能である。 The communication I/F controller 208 connects and communicates with external devices via a network, and performs communication control processing over the network. For example, it is possible to communicate using TCP/IP, telephone lines such as ISDN, and 3G mobile phone lines.
尚、CPU201は、例えばRAM203内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ210上での表示を可能としている。また、CPU201は、ディスプレイ210上の不図示のマウスカーソル等でのユーザ指示を可能とする。 The CPU 201 can display the outline font on the display 210 by, for example, rasterizing it in an area for display information in the RAM 203. The CPU 201 also enables user instructions using a mouse cursor (not shown) on the display 210.
図3は差分DB120の一例である。差分DB120は、ユーザの編集内容を、文書からの差分にして格納するDBであり、編集対象となる文書を識別するための文書ID121、その文書の編集対象となる項目を示す編集対象項目122、編集内容123を項目として備える。編集内容123は、当該文書の当該項目に対して行う編集操作を示す操作124と値125を備える。ここで、編集対象項目122は、検索DB130に存在する項目であって、文書変換部142で付与されたタグのような文書DB110に存在しない項目であっても良い。 Figure 3 shows an example of the difference DB 120. The difference DB 120 is a DB that stores user edit content as differences from a document, and includes the following items: a document ID 121 for identifying the document to be edited, an edit target item 122 indicating the item to be edited in that document, and edit content 123. The edit content 123 includes an operation 124 indicating the editing operation to be performed on that item in the document, and a value 125. Here, the edit target item 122 is an item that exists in the search DB 130, and may be an item that does not exist in the document DB 110, such as a tag added by the document conversion unit 142.
例えば、差分DB120のレコード126は、検索DB130の文書1(つまりレコード135)の項目「タグ」の値に「特許文献」「IT」を追加し「社員共通」を削除することと、項目「作成者」の値を「夢野 久作」にすることで、ユーザの編集内容を検索DB130に反映できることを示している。処理の詳細については図6で後述する。 For example, record 126 of differential DB 120 indicates that the user's edits can be reflected in search DB 130 by adding "Patent Document" and "IT" to the values of the "Tag" field of document 1 (i.e., record 135) in search DB 130, deleting "Common to All Employees," and setting the value of the "Creator" field to "Yumeno Kyusaku." Details of this process will be described later in Figure 6.
尚、本発明を説明するための最小限の構成として、前述の項目を例示しているが、編集を行ったユーザの識別子や編集履歴など、検索システムとして利用する項目を追加で備えても良い。 Note that the above items are shown as an example of the minimum configuration for explaining the present invention, but additional items to be used as a search system, such as the identifier of the user who performed the edit and the edit history, may also be included.
次に図3~図5を例に取りながら、図6のフローチャートを用いて、本発明の実施形態における文書差分統合部143と編集内容反映処理部153が実行する、ユーザの編集内容を検索DB130に反映する処理について説明する。 Next, using the flowchart in Figure 6 and Figure 3 to Figure 5 as examples, we will explain the process of reflecting user edits in the search DB 130, which is executed by the document difference integration unit 143 and edit content reflection processing unit 153 in an embodiment of the present invention.
図5は検索DB130の一例である。これは、図4で例示された検索DB130に対して、図3で例示された差分DB120の内容が反映された後の状態を表している。以下はこれを例として説明する。尚、説明のためここでは編集内容反映処理部153での処理を前提としているが、文書差分統合部143での処理も同様である。但し、この場合は、図4で例示されたものは、文書変換部142で変換された後の文書の状態を表している。 Figure 5 is an example of the search DB 130. This shows the state after the contents of the difference DB 120 illustrated in Figure 3 have been reflected in the search DB 130 illustrated in Figure 4. The following explanation will use this as an example. For the sake of explanation, we will assume that processing is performed by the edit content reflection processing unit 153, but the processing by the document difference integration unit 143 is similar. However, in this case, the example shown in Figure 4 shows the state of the document after conversion by the document conversion unit 142.
図6のフローチャートは、検索DB130の各レコードもしくは差分DB120の各レコードについて実行される処理であり、当該レコードに対応する検索DB130のレコードに編集内容が反映されることを示すものである。 The flowchart in Figure 6 shows the processing performed for each record in the search DB 130 or each record in the differential DB 120, and shows how the edited content is reflected in the record in the search DB 130 corresponding to that record.
ステップS601では、検索DB130から文書Aを、差分DB120から差分aを取得する。ここで、検索DB130と差分DB120は同一のキーとして文書IDを持つので、文書Aと差分aは一対一対応する。尚、ここでのAとaの取得方法は、検索DB130の各レコードを取得してから同一の文書IDを持つ差分aを差分DB120から取得(なければ編集なしとして文書Aを更新しない)しても良いし、差分DB120の各レコードを取得してから同一の文書IDを持つ文書Aを検索DB130から取得しても良い。ここでは、文書Aとしてレコード135、差分aとしてレコード126を取得されることを例に挙げる。 In step S601, document A is obtained from search DB 130 and difference a is obtained from difference DB 120. Here, search DB 130 and difference DB 120 have the same document ID as the key, so document A and difference a have a one-to-one correspondence. Note that the method of obtaining A and a here can be to obtain each record in search DB 130 and then obtain difference a with the same document ID from difference DB 120 (if there is no difference, document A is not updated as there is no editing), or to obtain each record in difference DB 120 and then obtain document A with the same document ID from search DB 130. Here, we will take the example of obtaining record 135 as document A and record 126 as difference a.
ステップS602に於いて、差分aの編集対象項目それぞれについて繰り返す処理を開始する。このときの編集対象項目をαとする。レコード126の例であれば、編集対象項目αとして「タグ」もしくは「作成者」を取る。 In step S602, a repeat process is started for each item to be edited in difference a. The item to be edited at this time is designated as α. In the example of record 126, the item to be edited α would be "tag" or "creator."
ステップS603において、差分aの編集対象項目αの、編集内容それぞれについて繰り返す処理を開始する。このときの編集内容をβとする。レコード126の変数対象項目αが「作成者」のとき(レコード129)の例であれば、編集内容βは、「操作」が「置換」で「値」が「夢野 久作」を取る。 In step S603, the process begins, repeating the process for each edit content of edit target item α of difference a. The edit content at this time is designated β. In the example where variable target item α of record 126 is "Creator" (record 129), edit content β has an "Operation" of "Replace" and a "Value" of "Yumeno Kyusaku".
ステップS604では、編集内容βの「操作」を判定する。処理は、「操作」が「追加」のときステップS605、「削除」のときステップS606、「置換」のときステップS607に移る。但し、ここでは説明の簡単のために、「操作」の種類として「追加」「削除」「置換」の3つを例示しているが、検索DB130の値134に対する操作が他にあり得るならそれを定義して対応する処理を実装しても良いし、使用しない操作があれば定義しなくても良い。 In step S604, the "operation" of edit content β is determined. If the "operation" is "add," processing proceeds to step S605; if it is "delete," processing proceeds to step S606; if it is "replace," processing proceeds to step S607. However, for simplicity of explanation, three types of "operation" are shown here: "add," "delete," and "replace." However, if there are other possible operations for value 134 in search DB 130, they can be defined and corresponding processing can be implemented, and if there are operations that are not used, they do not need to be defined.
ステップS605では、編集内容βの「操作」が「追加」であるとき、文書Aの編集対象項目αの値に、編集内容βの「値」を追加する。例えば、編集内容βとしてレコード127の「編集内容」を考えるとき、文書Aとしてのレコード135の「タグ」(レコード137)は、「特許文献」「検索システム」「同義語」「社員共通」「IT」の5つとなる。尚、ここではこの「追加」操作は冪等性があるものとして定義したが、ないものとして定義しても良い。 In step S605, when the "operation" of edited content β is "add," the "value" of edited content β is added to the value of edit target item α of document A. For example, when considering the "edited content" of record 127 as edited content β, the "tags" (record 137) of record 135 as document A are five: "patent document," "search system," "synonym," "common to all employees," and "IT." Note that while this "add" operation is defined here as being idempotent, it may also be defined as not being idempotent.
ステップS606では、編集内容βの「操作」が「削除」であるとき、文書Aの編集対象項目αの値から、編集内容βの「値」を削除する。例えば、編集内容βとしてレコード128の「編集内容」を考えるとき、文書Aとしてのレコード135の「タグ」(レコード137)は、「特許文献」「検索システム」「同義語」の3つとなる。 In step S606, if the "operation" for edited content β is "delete," the "value" of edited content β is deleted from the value of edit target item α of document A. For example, when considering the "edited content" of record 128 as edited content β, the "tags" (record 137) of record 135 as document A are three: "patent document," "search system," and "synonym."
ステップS607では、編集内容βの「操作」が「置換」であるとき、文書Aの編集対象項目αの値を、編集内容βの「値」で置換する。例えば、編集内容βとしてレコード129の「編集内容」を考えるとき、文書Aとしてのレコード135の「作成者」(レコード136)は、「夢野 久作」に置き換えられる。 In step S607, when the "operation" of edit content β is "replace," the value of edit target item α of document A is replaced with the "value" of edit content β. For example, when considering the "edit content" of record 129 as edit content β, the "creator" (record 136) of record 135 of document A is replaced with "Yumeno Kyusaku."
ステップS608では、編集対象項目αに未処理の編集内容があれば処理をステップS603に戻し、全て処理が終了していればステップS609に進む。レコード126の例に即せば、編集対象項目αが「タグ」ならば、ステップS608が終了した時点で、レコード127及びレコード128によって、文書Aとしてのレコード135の「タグ」(レコード137)は「特許文献」「検索システム」「同義語」「IT」の4つとなり、レコード139の状態となっている。 In step S608, if there is any unprocessed editing content for edit target item α, processing returns to step S603; if all processing has been completed, processing proceeds to step S609. Using the example of record 126, if edit target item α is "tag," then at the end of step S608, due to records 127 and 128, the "tags" (record 137) of record 135 as document A will be four: "patent document," "search system," "synonym," and "IT," resulting in the state of record 139.
ステップS609では、差分aに未処理の編集対象項目があれば処理をステップS602に戻し、全て処理が終了していれば文書Aの編集作業を終了する。レコード126の例に即せば、ステップS609が終了した時点で、レコード126によってレコード135はレコード138の状態になっている。 In step S609, if there are any unprocessed items to be edited in difference a, the process returns to step S602; if all processing has been completed, the editing work on document A ends. Using the example of record 126, at the time step S609 is completed, record 135 has become record 138 due to record 126.
次に、図7、図8を用いて、本発明の実施形態に於ける、ユーザにより行われた編集内容を検索結果に反映する方法について説明する。 Next, using Figures 7 and 8, we will explain how edits made by a user are reflected in search results in an embodiment of the present invention.
図7は文書検索装置160がユーザのクライアント端末に表示するユーザインタフェースの一例であり、検索結果画面を示している。検索結果画面700は、検索クエリ入力フォーム701と、検索結果サマリ702から成る。検索結果サマリ702には、各検索結果文書の各項目を編集するため、編集コンポーネント710を備えている。編集コンポーネント710は、編集内容入力コンポーネント711と、編集確定ボタン712を備えている。検索結果画面700は、検索クエリ「特許」で検索された結果を表示している状態を示しており、検索結果サマリ702は、該当する文書は1件あり、それが画面上に表示されていることを示している。また、検索結果文書の内、文書1の作成者が編集されようとしている様子を示している。 Figure 7 shows an example of a user interface that the document search device 160 displays on a user's client terminal, illustrating a search result screen. The search result screen 700 consists of a search query input form 701 and a search result summary 702. The search result summary 702 includes an editing component 710 for editing each item in each search result document. The editing component 710 includes an editing content input component 711 and an edit confirmation button 712. The search result screen 700 shows the results of a search using the search query "patent," and the search result summary 702 indicates that one matching document was found and is displayed on the screen. It also shows that the creator of document 1, one of the search result documents, is about to be edited.
ユーザは検索結果の項目を変更する場合に、編集内容入力コンポーネント711に編集内容を入力し、編集確定ボタン712を押下する。尚、ここでは説明の簡単のために、編集コンポーネント710としてユーザが自由入力したテキストをボタンで確定する方式を用いているが、予め用意された選択肢から選ぶ方式やファイル入力、または複数値を入力する場合は値の追加・削除が容易となるような入力方式など、異なる形式の編集コンポーネントでも良い。 When a user wants to change an item in a search result, they enter the edit content into the edit content input component 711 and press the edit confirmation button 712. Note that for simplicity of explanation, the edit component 710 uses a method in which the user freely enters text and confirms it with a button, but other types of edit components may also be used, such as a method in which the user selects from pre-prepared options, file input, or an input method that makes it easy to add or delete values when entering multiple values.
ユーザが編集内容を確定したら、編集内容は編集内容受信部151へと送信される。このとき、編集内容は差分DB120に合う形にクライアント端末で整形してから送信しても良いし、編集内容受信部151で整形しても良い。検索結果画面700の編集の例であれば、検索DB130内の、文書IDが文書1なる文書の、作成者を「夢野 久作」に置換するという内容が送信される。 Once the user has confirmed the edited content, the edited content is sent to the edited content receiving unit 151. At this time, the edited content may be formatted on the client terminal to fit the differential DB 120 before being sent, or may be formatted by the edited content receiving unit 151. In the example of editing the search results screen 700, the content sent would be to replace the creator of the document with document ID Document 1 in the search DB 130 with "Yumeno Kyusaku."
編集内容受信部151が受け取った編集内容は、編集内容登録処理部152によって、差分DB120で保持される。検索結果画面700の編集の例であれば、レコード129が登録される。これにより、ユーザの編集内容は永続化される。もし、次に文書登録装置140によって、当該文書が再度文書DB110から取得されて検索DB130に登録されようとしたときでも、差分DB120からレコードを得た文書差分統合部143が、ユーザの編集内容を検索DB130に反映させることが可能となる。 The edited content received by the edited content receiving unit 151 is stored in the difference DB 120 by the edited content registration processing unit 152. In the example of editing the search result screen 700, record 129 is registered. This makes the user's edited content permanent. Even if the document registration device 140 next attempts to retrieve the document from the document DB 110 again and register it in the search DB 130, the document difference integration unit 143, which has obtained the record from the difference DB 120, can reflect the user's edited content in the search DB 130.
また一方で、編集内容受信部151が受け取った編集内容は、即座に、編集内容反映処理部153によって、図6で前述した処理により、検索DB130へと反映される。これにより、次回の文書登録装置140による文書登録処理を待たずして、検索DB130にユーザの編集内容が反映される。 On the other hand, the edited content received by the edited content receiving unit 151 is immediately reflected in the search DB 130 by the edited content reflection processing unit 153 through the process described above in FIG. 6. This allows the user's edited content to be reflected in the search DB 130 without waiting for the next document registration process by the document registration device 140.
図8は、検索結果画面700に於いて、ユーザが検索結果に対して編集を行った後に、同一の検索クエリで再検索した結果画面の一例である。検索結果サマリ702中のレコード703が、ユーザの編集内容を反映していることが見て取れる。 Figure 8 shows an example of the results screen displayed when a user performs a second search using the same search query after editing the search results on the search results screen 700. It can be seen that records 703 in the search result summary 702 reflect the user's edits.
また、編集後の項目の内容を検索時のキーとして使用してもよい。そうすれば、ユーザは特定の項目の内容をキーに特定の文書を検索することが可能となる。 The edited contents of the item can also be used as a search key. This allows users to search for specific documents using the contents of a specific item as a search key.
上記により、検索対象文書集合と検索DBを分けた検索システムにおいて、ユーザが検索結果に対して行った編集内容を保持することが可能となる。 As a result of the above, in a search system where the set of documents to be searched and the search database are separated, it is possible to retain the edits made by the user to the search results.
以上、本発明に係る実施形態について示したが、本発明は、例えば、システム、装置、方法、プログラムもしくは記録媒体等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。 The above describes an embodiment of the present invention, but the present invention can also be embodied as, for example, a system, device, method, program, or recording medium. Specifically, the present invention may be applied to a system consisting of multiple devices, or to an apparatus consisting of a single device.
また、本発明におけるプログラムは、各フローチャートの処理方法をコンピュータが実行可能なプログラムである。なお、本発明におけるプログラムは各フローチャートの各装置の処理方法ごとのプログラムであってもよい。 The program of the present invention is a program that enables a computer to execute the processing method of each flowchart. Note that the program of the present invention may also be a program for each processing method of each device in each flowchart.
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。 As described above, it goes without saying that the object of the present invention can also be achieved by supplying a recording medium containing a program that realizes the functions of the above-mentioned embodiments to a system or device, and having the computer (or CPU or MPU) of that system or device read and execute the program stored on the recording medium.
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。 In this case, the program read from the recording medium itself will realize the novel functions of the present invention, and the recording medium on which the program is recorded will constitute the present invention.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、CD-R、DVD-ROM、磁気テープ、不揮発性のメモリカード、ROM、EPROM、シリコンディスク等を用いることが出来る。 Storage media for supplying the program include, for example, flexible disks, hard disks, optical disks, magneto-optical disks, CD-ROMs, CD-Rs, DVD-ROMs, magnetic tapes, non-volatile memory cards, ROMs, EPROMs, silicon disks, etc.
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 It goes without saying that the functions of the above-mentioned embodiments are not only realized by the computer executing a program read by the computer, but also include cases where the OS (operating system) running on the computer performs some or all of the actual processing based on the instructions of the program, and the functions of the above-mentioned embodiments are realized through that processing.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, it goes without saying that this also includes cases where a program read from a recording medium is written into memory on a function expansion board inserted into a computer or on a function expansion unit connected to a computer, and then a CPU or the like on the function expansion board or function expansion unit performs some or all of the actual processing based on the instructions of the program code, thereby realizing the functions of the above-mentioned embodiments.
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 The present invention may be applied to a system consisting of multiple devices, or to a device consisting of a single device. It goes without saying that the present invention can also be applied to cases where the invention is achieved by supplying a program to a system or device. In this case, the system or device can enjoy the effects of the present invention by reading a recording medium containing a program for achieving the invention into the system or device.
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。 Furthermore, by downloading and reading the program for achieving the present invention from a server, database, etc. on a network using a communications program, the system or device can enjoy the effects of the present invention. Note that configurations that combine the above-mentioned embodiments and their variations are all included in the present invention.
100 文書検索システム 100 Document Search System
Claims (7)
前記文書に付随する情報に対する変更内容を当該文書に対応付けて記録する記録手段と、
前記文書に付随する情報が再び登録された場合に、前記記録した変更内容に基づいて、前記文書に付随する情報を更新する更新手段と、
を備えることを特徴とする情報処理装置。 a registration means for registering information associated with a document collected from a document management source;
a recording means for recording changes to the information accompanying the document in association with the document;
an updating means for updating the information associated with the document based on the recorded changes when the information associated with the document is registered again;
An information processing device comprising:
記録手段が、前記文書に付随する情報に対する変更内容を当該文書に対応付けて記録する記録ステップと、
更新手段が、前記文書に付随する情報が再び登録された場合に、前記記録した変更内容に基づいて、前記文書に付随する情報を更新する更新ステップと、
を備えることを特徴とする情報処理装置の制御方法。 a registration step in which the registration means registers information associated with the document collected from the document management source;
a recording step in which a recording means records changes to information associated with the document in association with the document;
an updating step in which, when the information associated with the document is registered again, an updating means updates the information associated with the document based on the recorded changes;
10. A method for controlling an information processing device, comprising:
文書管理元から収集した文書に対応付く、当該文書に付随する情報を登録する登録手段と、
前記文書に付随する情報に対する変更内容を当該文書に対応付けて記録する記録手段と、
前記文書に付随する情報が再び登録された場合に、前記記録した変更内容に基づいて、前記文書に付随する情報を更新する更新手段と、
として機能させるためのプログラム。
Computer,
a registration means for registering information associated with a document collected from a document management source;
a recording means for recording changes to the information accompanying the document in association with the document;
an updating means for updating the information associated with the document based on the recorded changes when the information associated with the document is registered again;
A program to function as a
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024010330A JP2025115724A (en) | 2024-01-26 | 2024-01-26 | Information processing device, control method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2024010330A JP2025115724A (en) | 2024-01-26 | 2024-01-26 | Information processing device, control method, and program |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2025115724A true JP2025115724A (en) | 2025-08-07 |
Family
ID=96626798
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2024010330A Pending JP2025115724A (en) | 2024-01-26 | 2024-01-26 | Information processing device, control method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2025115724A (en) |
-
2024
- 2024-01-26 JP JP2024010330A patent/JP2025115724A/en active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6809748B2 (en) | Method and apparatus for setting a limitation of copy to generated data in a system having a plurality of information processing apparatuses connected to a network | |
JP5437557B2 (en) | Search processing method and search system | |
RU2427896C2 (en) | Annotation of documents in jointly operating applications by data in separated information systems | |
US20020078197A1 (en) | System and method for saving and managing browsed data | |
US9171132B1 (en) | Electronic note management system and user-interface | |
WO1994011830A1 (en) | File directory structure generator and retrieval tool for use on a network | |
JP2022069790A (en) | Information processing equipment, information processing method, program | |
JP3994188B2 (en) | Multimedia data search system, multimedia search method, and program for realizing the search method | |
JP2012159917A (en) | Document management system, document management method and program | |
JP2001154893A (en) | File search device and computer-readable recording medium | |
JP2001256255A (en) | Data search device and data search method | |
US6947926B2 (en) | Data processing method and apparatus and storage medium | |
JP5128386B2 (en) | Information processing apparatus, electronic form management system, server apparatus, form retrieval method, and program | |
JP2025115724A (en) | Information processing device, control method, and program | |
KR100310716B1 (en) | A method for sharing data among a plurality of applications in a hand-held device | |
JP5402916B2 (en) | File management apparatus, and control method and program thereof. | |
JP2007193408A (en) | Disk operation control method in document management system | |
JP7054011B2 (en) | Information processing system, information processing device, information processing method, program | |
JP2000172680A (en) | Document registration system, document registration method, recording medium for executing the method, document browsing system, document browsing method, recording medium for executing the method, and document retrieval system | |
JP7545061B2 (en) | Information processing system, information processing method, and program | |
JP7041367B2 (en) | Information processing system, control method, program | |
JP2008021031A (en) | Search server device and control method thereof, information processing device and control method thereof, information processing system, information search device and control method thereof, program, storage medium | |
JP7116323B2 (en) | Information processing system, control method, program | |
JP2018077654A (en) | Information processing device, and method and program for controlling information processing device | |
JP2023176448A (en) | Information processing device, information processing system, information processing method, and program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20250826 |