[go: up one dir, main page]

JP2005234731A - Document sorting apparatus and method - Google Patents

Document sorting apparatus and method Download PDF

Info

Publication number
JP2005234731A
JP2005234731A JP2004040814A JP2004040814A JP2005234731A JP 2005234731 A JP2005234731 A JP 2005234731A JP 2004040814 A JP2004040814 A JP 2004040814A JP 2004040814 A JP2004040814 A JP 2004040814A JP 2005234731 A JP2005234731 A JP 2005234731A
Authority
JP
Japan
Prior art keywords
classification
document
user action
criteria
monitored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004040814A
Other languages
Japanese (ja)
Inventor
Katsunori Yoshiji
克典 芳地
Takeshi Nagamine
猛志 永峯
Akio Yamashita
明男 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004040814A priority Critical patent/JP2005234731A/en
Publication of JP2005234731A publication Critical patent/JP2005234731A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To monitor user's actions and adjust criteria of classification category after the fact. <P>SOLUTION: A document reception section 10 receives documents continuously. A document classification section 11 classifies the documents received in the document reception section 10 based on preliminarily set classification category criteria. A document display list of a classification category is displayed by input operation of a U/I section 15, and the document is opened by same document designation. A user action monitoring section 17 analyzes summary text of an opened document and records frequencies of important phrases. A classification criterion adjustment section 18 records continuously frequencies of important phrases and add the keyword with high importance for a long term, and the one increasing the importance with the lapse of time to the keywords to be used as criteria of the classification category. <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

この発明は、所定の分類基準に基づいて文書を分類する文書分類技術に関し、とくに、分類基準を最適化させるようにしたものである。   The present invention relates to a document classification technique for classifying documents based on a predetermined classification standard, and in particular, optimizes the classification standard.

分類枠ごとに分類を特徴付けるキーワードを設定しておき、そのキーワードに関連の高い文書をその分類枠に割り振る文書分類技術が知られている。キーワード間に重み付けが付されることもある。ユーザは、所望の分類枠を指定して話題やテーマを絞り込んで文書を閲覧することができる。ところで、登録される文書やユーザのニーズ等を当初から正確に把握した上で種々の観点を考慮してキーワードを設定することは困難であり、当初設定したキーワードでは予定した文書が適切に分類されないということも多い。   A document classification technique is known in which a keyword that characterizes a classification is set for each classification frame, and a document highly related to the keyword is allocated to the classification frame. Weights may be assigned between keywords. The user can browse a document by specifying a desired classification frame and narrowing down topics and themes. By the way, it is difficult to set keywords in consideration of various viewpoints after accurately grasping the registered documents and user needs from the beginning, and the planned documents are not properly classified with the initially set keywords. There are many cases.

事後的に分類枠のキーワードをチューニングすることが望まれる。なお、キーワードに代えて単語ベクトルを用いる場合には、サンプル文書セットから単語ベクトルを生成するが、この場合にも、サンプル文書セットと実際に所望される文書の集合とがずれることにより同様な問題がある。   It is desirable to tune the keywords of the classification frame after the fact. Note that when a word vector is used instead of a keyword, a word vector is generated from a sample document set. In this case as well, a similar problem occurs because the sample document set deviates from the actually desired document set. There is.

この発明と関連する特許文献としては以下のものがある。   Patent documents related to this invention include the following.

特許文献1は、学習を通じて、自動的にテキスト分類器をトレーニングする。文書を分類枠の分類基準に基づいて分類したあと、分類された文書(に含まれる単語ベクトル)を使って、分類基準をトレーニングすることを開示している。   Patent Document 1 automatically trains a text classifier through learning. It discloses that after classifying a document based on the classification criteria of the classification frame, training the classification criteria using the classified documents (word vectors contained therein).

特許文献2は、手動により分類条件を変更することを開示している。   Patent document 2 discloses changing the classification conditions manually.

特許文献3は、分類不能カテゴリについても特徴ベクトルを求め、分類不能カテゴリへの推定がある閾値以上になると、ユーザにカテゴリ作成を促すことを開示している。   Patent Document 3 discloses that a feature vector is also obtained for an unclassifiable category, and the user is prompted to create a category when the unclassifiable category estimate exceeds a certain threshold.

しかしながら、かかる特許文献の文書分類においては、分類される様式は最初に設定した分類枠の設定に固定され、再度ユーザが設定しなおすまで変えられることはなく、移り変わる環境やユーザの嗜好の変化に対応するためにはユーザが新たに設定しなおす必要がある。
特開平9−26963号公報 特開2000−305948公報 特開2002−117046公報
However, in such document classification of patent documents, the classification format is fixed to the setting of the classification frame set at the beginning, and is not changed until the user resets it again. In order to respond, the user needs to set again.
JP-A-9-26963 JP 2000-305948 A JP 2002-117046 A

この発明は、以上の事情を考慮してなされたものであり、環境やユーザの嗜好の変化等に応じて自動的に分類基準を調整する文書分類技術を提供することを目的としている。   The present invention has been made in view of the above circumstances, and an object of the present invention is to provide a document classification technique that automatically adjusts the classification criteria according to changes in the environment and user preferences.

この発明の構成例文書分類装置では、分類枠に分類を特徴付けるキーワードを設定しておき、そのキーワードに関連の高い文書をその分類枠に割り振る。ユーザは、任意の分類枠に分類された文書リストから、文書のタイトル、要約を見て、開く文書を選択する。そして、このようなユーザのアクションを監視し、開いた文書の内容(特にタイトル、要約)に含まれる単語を記録しておき、分類枠を特徴付ける単語を修正する。次回からの分類にユーザの嗜好の変化を反映させる。   In the configuration example document classification apparatus according to the present invention, a keyword that characterizes the classification is set in the classification frame, and a document highly related to the keyword is allocated to the classification frame. The user selects a document to be opened by looking at the title and summary of the document from a document list classified in an arbitrary classification frame. Then, such user actions are monitored, words included in the contents of the opened document (especially titles and summaries) are recorded, and the words characterizing the classification frame are corrected. The change of the user's preference is reflected in the classification from the next time.

さらにこの発明を説明する。   The present invention will be further described.

この発明の一側面によれば、上述の目的を達成するために、文書分類装置に:文書を受け付ける文書受付手段と;上記文書受付手段で受け付けた文書を分類基準に従って分類する文書分類手段と;上記分類手段による分類結果を表示する分類結果表示手段と;上記分類結果表示手段に表示された分類結果に基づいて入力されたユーザアクションを監視するユーザアクション監視手段と;上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整する分類基準調整手段とを設けるようにしている。   According to one aspect of the present invention, in order to achieve the above object, the document classification apparatus includes: a document reception unit that receives a document; a document classification unit that classifies the document received by the document reception unit according to a classification standard; Classification result display means for displaying a classification result by the classification means; User action monitoring means for monitoring a user action inputted based on the classification result displayed on the classification result display means; Monitoring by the user action monitoring means And a classification reference adjusting means for adjusting the classification reference based on the user action.

この構成においては、ユーザが文書分類装置を利用するときのユーザアクションを用いて分類基準を事後的に調整することができる。なお、分類基準の調整をユーザに知らせることなくすべて自動的に行なっても良いし、調整の準備が出来たらユーザや管理者に通知してユーザや管理者の確認の下で調整を行なうようにしても良い。   In this configuration, the classification criteria can be adjusted afterwards using a user action when the user uses the document classification device. All adjustments of classification criteria may be performed automatically without informing the user, or when adjustments are ready, the user or administrator is notified and adjustments are made with the confirmation of the user or administrator. May be.

上記分類基準は、例えば、分類に対して登録されたキーワードや、単語ベクトルである。キーワードには重みを付けても良い。   The classification standard is, for example, a keyword or word vector registered for classification. Keywords may be weighted.

上記ユーザアクション監視手段により監視されるユーザアクションは、例えば、分類された文書に対する閲覧操作である。ユーザは文書を閲覧するときに例えば文書リストから任意の文書を選択し本文表示させる。   The user action monitored by the user action monitoring unit is, for example, a browsing operation for a classified document. For example, when viewing a document, the user selects an arbitrary document from a document list and displays the text.

上記ユーザアクション監視手段は、閲覧時間を監視するようにしてもよい。   The user action monitoring means may monitor browsing time.

その他の監視対象のユーザアクションは、例えば、分類された文書に対する複製保管やコメント(アノテーション)付け、他のユーザへの推奨であるが、これらに限定されない。文書の複製保管は、文書属性や文書アドレスのみ行なうようにしても良い。この場合、文書の本体は複製保管されない。   Other user actions to be monitored include, for example, copy storage, commenting (annotation) for classified documents, and recommendations to other users, but are not limited thereto. Document copying and storage may be performed only for document attributes and document addresses. In this case, the document body is not duplicated and stored.

上記分類基準調整手段は、例えば、キーワードの追加または削除により分類基準を調整する。例えば、上記ユーザアクション監視手段により監視されたユーザアクションにかかる文書から抽出した語句に基づいて決定されたキーワードを追加したり、キーワードに付けられた重みを増減する。   The classification standard adjusting means adjusts the classification standard by adding or deleting keywords, for example. For example, a keyword determined based on a phrase extracted from a document related to a user action monitored by the user action monitoring unit is added, or the weight attached to the keyword is increased or decreased.

また、この発明の他の側面によれば、文書分類装置に:文書を受け付ける文書受付手段と;上記文書受付手段で受け付けた文書を分類基準に従って複数の分類枠に分類する文書分類手段と;指定された分類枠の上記分類手段による分類結果を表示する分類結果表示手段と;各分類枠に対するユーザアクションを監視するユーザアクション監視手段と;上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整する分類基準調整手段とを設け、さらに上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類枠の表示順位を変更するようにしている。   According to another aspect of the present invention, the document classification apparatus includes: a document reception unit that receives a document; a document classification unit that classifies the document received by the document reception unit into a plurality of classification frames according to a classification criterion; Classification result display means for displaying the classification result of the classified frame by the classification means; user action monitoring means for monitoring a user action for each classification frame; and based on the user action monitored by the user action monitoring means Classification reference adjusting means for adjusting the classification reference is provided, and the display order of the classification frames is changed based on the user action monitored by the user action monitoring means.

この構成においては各分類枠に対するユーザアクションに基づいて分類基準を調整し、活性度の少ない分類枠については文書が分類されにくいようにして事後的に調整を行なえる。例えば、分類基準として設定されたキーワードの重みを小さくしたり、分類判定の閾値を大きくしたりする。あわせて、分類枠の表示順位を活性度順に変更できる。   In this configuration, the classification standard is adjusted based on the user action for each classification frame, and it is possible to make adjustments afterwards so that the classification frame with less activity is less likely to be classified. For example, the weight of a keyword set as a classification criterion is reduced, or the threshold for classification determination is increased. In addition, the display order of the classification frames can be changed in the order of activity.

なお、この発明は装置またはシステムとして実現できるのみでなく、方法としても実現可能である。また、そのような発明の一部をソフトウェアとして構成することができることはもちろんである。またそのようなソフトウェアをコンピュータに実行させるために用いるソフトウェア製品もこの発明の技術的な範囲に含まれることも当然である。   The present invention can be realized not only as an apparatus or a system but also as a method. Of course, a part of the invention can be configured as software. Of course, software products used to cause a computer to execute such software are also included in the technical scope of the present invention.

この発明の上述の側面および他の側面は特許請求の範囲に記載され以下実施例を用いて詳述される。   These and other aspects of the invention are set forth in the appended claims and will be described in detail below with reference to examples.

この発明によれば、ユーザが文書分類装置を利用するときのユーザアクションを用いて分類基準を事後的に調整することができる。   According to the present invention, the classification criteria can be adjusted afterwards using the user action when the user uses the document classification device.

以下、この発明の実施例について説明する。   Examples of the present invention will be described below.

図1は、この発明の実施例の文書分類装置の構成を全体として示しており、図2および図3は文書分類動作およびユーザアクション監視動作の例を示している。なお、この例では、文書管理装置をコンピュータ100に実装しているが、これに限定されない。   FIG. 1 shows the overall configuration of a document classification apparatus according to an embodiment of the present invention, and FIGS. 2 and 3 show examples of document classification operation and user action monitoring operation. In this example, the document management apparatus is mounted on the computer 100, but the present invention is not limited to this.

図1において、文書分類装置は、文書受付部10、文書分類部11、キーワード記憶部12、分類済み文書記憶部13、文書管理部14、U/I(ユーザインタフェース)部15、表示部16、ユーザアクション監視部17、分類基準調整部18等を含んで構成されている。   In FIG. 1, a document classification apparatus includes a document reception unit 10, a document classification unit 11, a keyword storage unit 12, a classified document storage unit 13, a document management unit 14, a U / I (user interface) unit 15, a display unit 16, It includes a user action monitoring unit 17, a classification reference adjustment unit 18, and the like.

文書受付部10は、文書を継続的に受け付け、あるいは定期的に文書を収集する。文書分類部11は、文書受付部10で受け付けた文書を、予め設定した分類枠基準(キーワードのリスト。重み付けがあっても良い)に基づいて分類する。キーワードは分類枠ごとにキーワード記憶部12に保管される。分類枠は例えば図4に示すようなものであり、それぞれの分類枠に複数のキーワードが登録されている。例えば、「野球」という分類枠には「本塁打」、「二塁打」、「安打」、「ホームラン」のキーワードが登録されている。分類された文書は分類済み文書記憶部13に保管される。   The document reception unit 10 continuously receives documents or collects documents regularly. The document classification unit 11 classifies the document received by the document reception unit 10 based on a preset classification frame criterion (a list of keywords, which may be weighted). The keywords are stored in the keyword storage unit 12 for each classification frame. The classification frame is as shown in FIG. 4, for example, and a plurality of keywords are registered in each classification frame. For example, in the classification frame “baseball”, keywords of “home run”, “double hit”, “hit”, and “home run” are registered. The classified documents are stored in the classified document storage unit 13.

なお、分類枠は1つの場合もあり、また分類枠のキーワードが1つの場合もある。キーワードに代えて単語ベクトルで分類を行なっても良い。   There may be one classification frame, and there may be one classification frame keyword. Classification may be performed using word vectors instead of keywords.

表示部16は、一つの分類枠に分類された文書のリスト表示や選択された文書の本文表示等を行なう。U/I部15は、ポインティングディバイスやキーボードを介してユーザの指示入力を受け付ける。この指示は文書管理部14およびユーザアクション監視部17に送信される。   The display unit 16 displays a list of documents classified into one classification frame, a text display of a selected document, and the like. The U / I unit 15 receives a user instruction input via a pointing device or a keyboard. This instruction is transmitted to the document management unit 14 and the user action monitoring unit 17.

文書管理部14はユーザからの指示入力に基づいて、指定された分類枠の文書リストの表示や、指定された文書の内容表示を表示部16において行なう。図5は文書リストの表示例(図4の「中国市場」の分類枠による分類)を示している。ユーザはリスト表示されたものの中から、タイトル、要約などを見て、開く文書を判断することができる。開く文書の指定はポインティングデバイス等を用いて行なえる。   Based on an instruction input from the user, the document management unit 14 displays the document list of the designated classification frame and the content of the designated document on the display unit 16. FIG. 5 shows a display example of the document list (classification by the classification frame of “China market” in FIG. 4). The user can determine the document to be opened by looking at the title, summary, etc. from the list displayed. The document to be opened can be specified using a pointing device or the like.

ユーザアクション監視部17は、例えば、開いた文書の内容テキスト(その要約テキストでもよい)を解析し、重要語句の頻度を記録する。例えば、図5の文書[1]、[3]を開いた場合には図6に示すように重要語句を抽出してその頻度を登録する。なお、図6の例では、出現語句を分割して登録した場合には、その頻度を按分した。なお、内容テキストの特徴量(ベクタースペース)を抽出して累積していくようにしても良い。   For example, the user action monitoring unit 17 analyzes the content text of the opened document (or its summary text) and records the frequency of the important phrase. For example, when the documents [1] and [3] in FIG. 5 are opened, as shown in FIG. 6, the important phrases are extracted and their frequencies are registered. In the example of FIG. 6, when the appearance words / phrases are divided and registered, the frequency is apportioned. Note that the feature amount (vector space) of the content text may be extracted and accumulated.

分類基準調整部18は、継続的に重要語句の頻度を記録しておき、長期に渡って重要度が高いキーワード、時間経過とともに重要度が高くなっているものを分類枠の判定基準となるキーワードに加える。反対に開かれなかった文書に含まれるキーワードは重要度が下がり、長期的に見ても重要そうでなければ判定基準から外す。具体的には、抽出した重要語句の出現頻度の定着度を判断する。例えば、長期挙動を監視する際の採用基準は、t(監視開始後の経過時間)>T(最低監視時間)という条件をつけて、kを定数、fを出現頻度とすると、下記の式1のFが所定の閾値を超えたときにキーワードとして登録するというものとすることができる。

Figure 2005234731
The classification standard adjusting unit 18 continuously records the frequency of important words and phrases, and keywords that have high importance over a long period of time and keywords that become high in importance over time are used as criteria for determining the classification frame. Add to. On the other hand, keywords included in documents that have not been opened are less important, and if they are not important in the long run, they are removed from the criteria. Specifically, the degree of fixation of the appearance frequency of the extracted important words is determined. For example, when the long-term behavior is monitored, the following criterion is adopted, where t (elapsed time after starting monitoring)> T (minimum monitoring time), k is a constant, and f is an appearance frequency. It can be registered as a keyword when the F of the user exceeds a predetermined threshold.
Figure 2005234731

図7の例では三角印の時点で閾値を上回り、「鳥インフルエンザ」をキーワードとして採用するようになっている。   In the example of FIG. 7, the threshold value is exceeded at the time of the triangle mark, and “bird flu” is adopted as a keyword.

また、すでに分類枠に採用されているキーワードについても、前記の長期監視を行い、閾値を下回るものについてはキーワードにつけられた重みを採用時に比較して低くするなどして、あまりにユーザの関心を引かない場合には分類基準から外すようにしても良い。   In addition, keywords that have already been used in the classification frame are also subject to excessive user interest by, for example, performing the long-term monitoring described above, and lowering the weight assigned to the keywords when they are below the threshold, compared to the time of adoption. If it does not exist, it may be excluded from the classification criteria.

つぎに図2および図3を参照する。   Reference is now made to FIGS.

図2は文書分類時の動作例を示している。図2において、文書受付部10が文書を登録し(S10)、文処分類部1が分類枠ごとのキーワードリストを参照して文書を分類し分類済み文書記憶部13に保管する(S11)。   FIG. 2 shows an example of operation during document classification. In FIG. 2, the document receiving unit 10 registers the document (S10), and the sentence disposal unit 1 classifies the document with reference to the keyword list for each classification frame and stores it in the classified document storage unit 13 (S11).

図3はユーザアクション監視動作例を示している。図3において、分類枠が指定されて当該分類枠の文書リストが表示される(S20)。文書リストの閉指示がある場合には処理を終了し、指示がない場合には文書が開かれるかどうか監視する(S21、S22)。文書が開かれた場合には語句の出現頻度を記録する(S23)。この後、キーワードとして採用するかどうかの採用基準を判断して、採用基準が満たされれば当該分類枠のキーワードとして追加する(S24、S25)。   FIG. 3 shows an example of a user action monitoring operation. In FIG. 3, a classification frame is designated and a document list of the classification frame is displayed (S20). If there is an instruction to close the document list, the process is terminated, and if there is no instruction, it is monitored whether the document is opened (S21, S22). When the document is opened, the appearance frequency of the phrase is recorded (S23). Thereafter, an adoption standard for determining whether or not to adopt as a keyword is determined, and if the adoption standard is satisfied, it is added as a keyword for the classification frame (S24, S25).

この実施例によれば、ユーザアクションに基づいて事後的にキーワードの追加等を行ない、分類基準の調整を行なえる。   According to this embodiment, keywords can be added afterwards based on the user action, and the classification criteria can be adjusted.

なお、この発明は上述の実施例に限定されるものではなくその趣旨を逸脱しない範囲で種々変更が可能である。例えば、図8に示すようにサーバ・クライアントシステムとして文書分類装置を構成しても良い。図8において図1と対応する箇所には対応する符号を付した。図8の例では、クライアントコンピュータ300のU/I部21から操作要求をサーバコンピュータ200の要求受信部19に送り、これに基づいて文書リスト表示や文書本体表示のためのデータを表示データ送信部20からクライアントコンピュータ300に送る。クライアントコンピュータ300の表示部22はこの表示データに基づいて文書リスト表示等を行なう。この例でもユーザアクション監視部17が要求受信部19の操作要求を監視してユーザアクションを記録する。   The present invention is not limited to the above-described embodiments, and various modifications can be made without departing from the spirit of the invention. For example, as shown in FIG. 8, the document classification apparatus may be configured as a server / client system. In FIG. 8, portions corresponding to those in FIG. In the example of FIG. 8, an operation request is sent from the U / I unit 21 of the client computer 300 to the request receiving unit 19 of the server computer 200, and based on this, data for document list display and document body display is displayed. 20 to the client computer 300. The display unit 22 of the client computer 300 displays a document list based on this display data. Also in this example, the user action monitoring unit 17 monitors the operation request of the request receiving unit 19 and records the user action.

また、上述の例では主にキーワードによる分類基準について説明したが、単語ベクトルを分類基準とした場合にも同様に分類基準の調整を行なえる、例えば、開いた文書の要約や本文の単語頻度を記録して単語ベクトルを調整するようにしても良い。tf*IDFを用いても良い。   In the above example, the classification criteria based on keywords have been mainly described. However, the classification criteria can be adjusted in the same manner even when word vectors are used as the classification criteria. The word vector may be adjusted by recording. tf * IDF may be used.

また、監視対象のユーザアクションは文書のオープン処理に限定されず、複製保管、他のユーザへの推奨処理、コメントやアノテーションの追加処理等であってもよい。文書をオープンしている時間を考慮しても良い。   The user action to be monitored is not limited to the document open process, and may be a copy storage, a recommendation process for other users, a comment or annotation addition process, and the like. You may consider the time the document is open.

また、ユーザのアクションを反映させるのは分類基準(キーワード)だけでなく、分類枠の活性度としての見方もある。活性度が低い分類枠には、文書分類の際に文書が分類されにくくしたり、分類枠ランキングリストの順位にも用いることも出来る。活性度は、例えば、分類枠の文書リスト表示の頻度やその分類リスト表示中の文書のオープン処理等に基づいて統計的に求めることができる。   Further, not only the classification standard (keyword) but also the view of the activity of the classification frame reflects the user's action. A classification frame having a low activity level can be used to make it difficult to classify a document during document classification, or can be used for the ranking of a classification frame ranking list. The degree of activity can be statistically obtained based on, for example, the frequency of displaying the document list of the classification frame, the open processing of the document being displayed in the classification list, and the like.

この発明の実施例の構成を全体として示す図である。It is a figure which shows the structure of the Example of this invention as a whole. 上述実施例の文書分類動作例を説明するフローチャートである。It is a flowchart explaining the example of document classification operation | movement of the said Example. 上述実施例のユーザアクション監視動作例を説明するフローチャートである。It is a flowchart explaining the user action monitoring operation example of the above-mentioned embodiment. 上述実施例の分類枠およびキーワードの例を説明する図である。It is a figure explaining the example of the classification frame of the above-mentioned Example, and a keyword. 上述実施例の文書リストの表示例を説明する図である。It is a figure explaining the example of a display of the document list of the above-mentioned Example. 上述実施例のユーザアクションの記録例を説明する図である。It is a figure explaining the example of a recording of the user action of the above-mentioned Example. 上述実施例の長期挙動の監視例を説明する図である。It is a figure explaining the example of monitoring of the long-term behavior of the above-mentioned example. 上述実施例の変形例を説明する図である。It is a figure explaining the modification of the above-mentioned Example.

符号の説明Explanation of symbols

10 文書受付部
11 文書分類部
12 キーワード記憶部
13 文書記憶部
14 文書管理部
15 U/I部
16 表示部
17 ユーザアクション監視部
18 分類基準調整部
19 要求受信部
20 表示データ送信部
21 U/I部
22 表示部
100 コンピュータ
200 サーバコンピュータ
300 クライアントコンピュータ
DESCRIPTION OF SYMBOLS 10 Document reception part 11 Document classification | category part 12 Keyword storage part 13 Document storage part 14 Document management part 15 U / I part 16 Display part 17 User action monitoring part 18 Classification reference adjustment part 19 Request reception part 20 Display data transmission part 21 U / I unit 22 display unit 100 computer 200 server computer 300 client computer

Claims (14)

文書を受け付ける文書受付手段と、
上記文書受付手段で受け付けた文書を分類基準に従って分類する文書分類手段と、
上記分類手段による分類結果を表示する分類結果表示手段と、
上記分類結果表示手段に表示された分類結果に基づいて入力されたユーザアクションを監視するユーザアクション監視手段と、
上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整する分類基準調整手段とを有することを特徴とする文書分類装置。
A document receiving means for receiving a document;
Document classification means for classifying the documents received by the document reception means according to the classification criteria;
Classification result display means for displaying the classification result by the classification means;
User action monitoring means for monitoring a user action input based on the classification result displayed on the classification result display means;
A document classification apparatus comprising: a classification reference adjusting unit that adjusts the classification reference based on a user action monitored by the user action monitoring unit.
上記分類基準は分類に対して登録されたキーワード及びキーワードにつけられた重みである請求項1記載の文書分類装置。   2. The document classification apparatus according to claim 1, wherein the classification standard is a keyword registered for classification and a weight attached to the keyword. 上記ユーザアクション監視手段により監視されるユーザアクションは、分類された文書に対する閲覧操作である請求項2記載の文書分類装置。   3. The document classification apparatus according to claim 2, wherein the user action monitored by the user action monitoring means is a browsing operation for the classified document. 上記ユーザアクション監視手段は、閲覧時間を監視する請求項3記載の文書分類装置。   4. The document classification apparatus according to claim 3, wherein the user action monitoring means monitors browsing time. 上記ユーザアクション監視手段により監視されるユーザアクションは、分類された文書に対する複製保管である請求項1記載の文書分類装置。   2. The document classification apparatus according to claim 1, wherein the user action monitored by the user action monitoring means is a copy storage for the classified document. 上記分類基準調整手段は、キーワードの追加または削除、又はキーワードにつけられた重みの増減により分類基準を調整する請求項2または3記載の文書分類装置。   4. The document classification apparatus according to claim 2, wherein the classification standard adjusting unit adjusts the classification standard by adding or deleting keywords or increasing or decreasing weights assigned to the keywords. 上記ユーザアクション監視手段により監視されたユーザアクションにかかる文書から抽出した語句に基づいて追加するキーワード、又はキーワードに付けられた重みの増減を決定する請求項6記載の文書分類装置。   7. The document classification apparatus according to claim 6, wherein a keyword to be added or an increase / decrease in a weight attached to the keyword is determined based on a word / phrase extracted from the document related to the user action monitored by the user action monitoring means. 上記ユーザアクションは、分類された文書に対するコメントの付与である請求項1記載の文書分類装置。   The document classification apparatus according to claim 1, wherein the user action is addition of a comment to the classified document. 上記分類基準は分類毎に設定された単語ベクトルである請求項1記載の文書分類装置。   The document classification apparatus according to claim 1, wherein the classification standard is a word vector set for each classification. 文書受付手段が文書を受け付けるステップと、
文書分類手段が上記文書受付手段により受け付けた文書を分類基準に従って分類するステップと、
分類結果表示手段が上記分類手段による分類結果を表示するステップと、
ユーザアクション監視手段が上記分類結果表示手段に表示された分類結果に基づいて入力されたユーザアクションを監視するステップと、
分類基準調整手段が上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整するステップとを有することを特徴とする文書分類方法。
A step of receiving a document by the document receiving means;
Classifying the document received by the document receiving means by the document receiving means according to the classification criteria;
A step in which the classification result display means displays the classification result by the classification means;
A step in which the user action monitoring means monitors a user action input based on the classification result displayed on the classification result display means;
And a step of adjusting the classification standard based on a user action monitored by the user action monitoring unit.
文書受付手段が文書を受け付けるステップと、
文書分類手段が上記文書受付手段により受け付けた文書を分類基準に従って分類するステップと、
分類結果表示手段が上記分類手段による分類結果を表示するステップと、
ユーザアクション監視手段が上記分類結果表示手段に表示された分類結果に基づいて入力されたユーザアクションを監視するステップと、
分類基準調整手段が上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整するステップとをコンピュータに実行させるために用いられることを特徴とする文書分類用コンピュータプログラム。
A step of receiving a document by the document receiving means;
Classifying the document received by the document receiving means by the document receiving means according to the classification criteria;
A step in which the classification result display means displays the classification result by the classification means;
A step in which the user action monitoring means monitors a user action input based on the classification result displayed on the classification result display means;
A computer program for classifying a document, characterized in that a classification reference adjusting unit is used to cause a computer to execute a step of adjusting the classification criterion based on a user action monitored by the user action monitoring unit.
文書を受け付ける文書受付手段と、
上記文書受付手段で受け付けた文書を分類基準に従って複数の分類枠に分類する文書分類手段と、
指定された分類枠の上記分類手段による分類結果を表示する分類結果表示手段と、
各分類枠に対するユーザアクションを監視するユーザアクション監視手段と、
上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整する分類基準調整手段とを有し、
さらに上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類枠の表示順位を変更することを特徴とする文書分類装置。
A document receiving means for receiving a document;
Document classification means for classifying the documents received by the document reception means into a plurality of classification frames according to classification criteria;
A classification result display means for displaying a classification result by the classification means for the specified classification frame;
User action monitoring means for monitoring user actions for each classification frame;
Classification criteria adjusting means for adjusting the classification criteria based on the user action monitored by the user action monitoring means,
Furthermore, the document classification apparatus characterized in that the display order of the classification frame is changed based on the user action monitored by the user action monitoring means.
文書受付手段が文書を受け付けるステップと、
文書分類手段が上記文書受付手段で受け付けた文書を分類基準に従って複数の分類枠に分類するステップと、
分類結果表示手段が、指定された分類枠の上記分類手段による分類結果を表示するステップと、
ユーザアクション監視手段が各分類枠に対するユーザアクションを監視するステップと、
分類基準調整手段が上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整するステップとを有し、
さらに上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類枠の表示順位を変更することを特徴とする文書分類方法。
A step of receiving a document by the document receiving means;
The document classification means classifying the document received by the document reception means into a plurality of classification frames according to the classification criteria;
A step in which the classification result display means displays the classification result of the designated classification frame by the classification means;
A user action monitoring means for monitoring a user action for each classification frame;
A classification reference adjusting means adjusting the classification reference based on the user action monitored by the user action monitoring means;
Furthermore, the display order of the said classification frame is changed based on the user action monitored by the said user action monitoring means, The document classification method characterized by the above-mentioned.
文書受付手段が文書を受け付けるステップと、
文書分類手段が上記文書受付手段で受け付けた文書を分類基準に従って複数の分類枠に分類するステップと、
分類結果表示手段が、指定された分類枠の上記分類手段による分類結果を表示するステップと、
ユーザアクション監視手段が各分類枠に対するユーザアクションを監視するステップと、
分類基準調整手段が上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類基準を調整するステップとをコンピュータに実行させるために用いられ、さらに上記ユーザアクション監視手段により監視されたユーザアクションに基づいて上記分類枠の表示順位を変更する機能を有することを特徴とする文書分類用コンピュータプログラム。
A step of receiving a document by the document receiving means;
The document classification means classifying the document received by the document reception means into a plurality of classification frames according to the classification criteria;
A step in which the classification result display means displays the classification result of the designated classification frame by the classification means;
A user action monitoring means for monitoring a user action for each classification frame;
And a step of adjusting the classification criteria based on the user action monitored by the user action monitoring means, and the user action monitored by the user action monitoring means. A computer program for classifying a document, which has a function of changing the display order of the classification frame based on the above.
JP2004040814A 2004-02-18 2004-02-18 Document sorting apparatus and method Pending JP2005234731A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004040814A JP2005234731A (en) 2004-02-18 2004-02-18 Document sorting apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004040814A JP2005234731A (en) 2004-02-18 2004-02-18 Document sorting apparatus and method

Publications (1)

Publication Number Publication Date
JP2005234731A true JP2005234731A (en) 2005-09-02

Family

ID=35017643

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004040814A Pending JP2005234731A (en) 2004-02-18 2004-02-18 Document sorting apparatus and method

Country Status (1)

Country Link
JP (1) JP2005234731A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217398A (en) * 2007-03-05 2008-09-18 Hidetsugu Nanba Technical term classification device, technical term classification method, and program
JP2010282483A (en) * 2009-06-05 2010-12-16 Toshiba Corp Document classification apparatus and document classification program
JP2012022442A (en) * 2010-07-13 2012-02-02 Sony Corp Information processing device, information processing method and computer program
KR101182280B1 (en) * 2007-03-17 2012-09-14 삼성전자주식회사 Document management method and document management apparatus
US9069883B2 (en) 2007-03-17 2015-06-30 Samsung Electronics Co., Ltd. Document management method and document management apparatus using the same

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008217398A (en) * 2007-03-05 2008-09-18 Hidetsugu Nanba Technical term classification device, technical term classification method, and program
KR101182280B1 (en) * 2007-03-17 2012-09-14 삼성전자주식회사 Document management method and document management apparatus
US9069883B2 (en) 2007-03-17 2015-06-30 Samsung Electronics Co., Ltd. Document management method and document management apparatus using the same
JP2010282483A (en) * 2009-06-05 2010-12-16 Toshiba Corp Document classification apparatus and document classification program
JP2012022442A (en) * 2010-07-13 2012-02-02 Sony Corp Information processing device, information processing method and computer program

Similar Documents

Publication Publication Date Title
AU2011201142B2 (en) Query revision using known highly-ranked queries
AU2005231113B2 (en) Systems and methods for weighting a search query result
KR101721338B1 (en) Search engine and implementation method thereof
US9672232B1 (en) Systems and methods for selectively storing event data
US8463775B2 (en) Temporal search query personalization
US8126930B2 (en) Micro-bucket testing for page optimization
US8543572B2 (en) Systems and methods for analyzing boilerplate
CA2789010C (en) Propagating classification decisions
US20090248610A1 (en) Extending media annotations using collective knowledge
JP5452823B2 (en) How computers perform to enforce privacy policies
US8990201B1 (en) Image search results provisoning
US20150006522A1 (en) Using user feedback to improve search results
US20090171938A1 (en) Context-based document search
US20040002945A1 (en) Program for changing search results rank, recording medium for recording such a program, and content search processing method
US20110010322A1 (en) Method and system for transitioning from a case-based classifier system to a rule-based classifier system
US20130086079A1 (en) Graphical user interface for interacting with automatically generated user profiles
US20110252013A1 (en) System and method for selecting search results facets
US20200401638A1 (en) Method of and system for generating search query completion suggestion on search engine
JP2018206361A (en) System and method for user-oriented topic selection and browsing, and method, program, and computing device for displaying multiple content items
US20160048764A1 (en) News feed
JP2007241451A (en) Information collection support device
CN109508456A (en) A kind of text handling method and device
JP2007528531A (en) Search service system and method for providing input order of keywords by category
JP2005234731A (en) Document sorting apparatus and method
JP4699148B2 (en) Keyword extraction device, keyword extraction program