[go: up one dir, main page]

JP2002334045A - E-mail classification method, its implementation device and its processing program - Google Patents

E-mail classification method, its implementation device and its processing program

Info

Publication number
JP2002334045A
JP2002334045A JP2001140820A JP2001140820A JP2002334045A JP 2002334045 A JP2002334045 A JP 2002334045A JP 2001140820 A JP2001140820 A JP 2001140820A JP 2001140820 A JP2001140820 A JP 2001140820A JP 2002334045 A JP2002334045 A JP 2002334045A
Authority
JP
Japan
Prior art keywords
importance
mail
words
extracted
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001140820A
Other languages
Japanese (ja)
Inventor
Keiko Iida
恵子 飯田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2001140820A priority Critical patent/JP2002334045A/en
Publication of JP2002334045A publication Critical patent/JP2002334045A/en
Pending legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】 【課題】 送信メールまたは受信メールに対して利用者
の興味を反映させた重み付けを自動的に行うことが可能
な技術を提供する。 【解決手段】 電子メールをその重要度に応じて分類す
る電子メール分類方法において、重要度の登録対象とな
っている電子メールのメール本文から単語の組を抽出す
るステップと、前記抽出された単語の組に対して重要度
を表す値を付与するステップと、前記抽出された単語の
組とその重要度を判定基準データに登録するステップ
と、重要度の判定対象となっている電子メールのメール
本文から単語の組を抽出するステップと、前記抽出され
た単語の組の重要度を前記判定基準データから読み出す
ステップと、前記読み出した重要度の値に応じて当該電
子メールを分類するステップとを有するものである。
(57) [Summary] [PROBLEMS] To provide a technique capable of automatically weighting a sent mail or a received mail reflecting the user's interest. In an e-mail classification method for classifying e-mails according to their importance, a step of extracting a set of words from an e-mail text of an e-mail whose importance is to be registered, Assigning a value representing the importance to the set of words, registering the extracted word set and its importance in the determination reference data, and Extracting a set of words from the text, reading the importance of the extracted set of words from the criterion data, and classifying the e-mail according to the read value of the importance. Have

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は電子メールを自動的
に分類する電子メール分類装置に関し、特に電子メール
を分類する際に利用者の興味を十分に反映した分類を行
う電子メール分類装置に適用して有効な技術に関するも
のである。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to an e-mail classifying apparatus for automatically classifying e-mails, and more particularly to an e-mail classifying apparatus for classifying e-mails that sufficiently reflects the interest of a user. And effective technology.

【0002】[0002]

【従来の技術】従来、受信した電子メールの分類には2
つの方式があった。1つはメールのタイトル・送信者等
のメールの属性によるもので、もう1つはメールの本文
を基準とするものである。
2. Description of the Related Art Conventionally, the classification of received e-mail
There were two formulas. One is based on the attributes of the mail, such as the title and sender of the mail, and the other is based on the body of the mail.

【0003】メールの本文を基準とする方法には、メー
ルの内容に従った分類法と、利用者の興味に従った分類
法の2つがある。前者は、メール中の語を、分野毎に単
語を分類した語彙分類辞書で参照し、どの分野の語が多
く現れるかを判定基準とする方法により実現が可能であ
った。後者は、前者の方法で使用する一般的な語彙分類
辞書の代わりに、利用者自身が興味ある語を登録したデ
ータを分類基準とすることで実現が可能であった。
There are two methods based on the body of the mail, a classification method according to the contents of the mail and a classification method according to the user's interest. The former method can be realized by a method in which words in an e-mail are referred to in a vocabulary classification dictionary in which words are classified for each field, and a word in which field appears frequently is used as a criterion. The latter could be realized by using data in which the user himself / herself registered words of interest as classification criteria instead of the general vocabulary classification dictionary used in the former method.

【0004】利用者が登録した興味のある語を分類の基
準とする方法(特開平9−305505号公報)が提案
されている。また、利用者が不要と判定した受信メール
からキーワードを自動抽出し、それに基づいて不要メー
ルの判定を行う方法(特開平11−15756号公報)
も提案されている。
A method has been proposed in which a word of interest registered by a user is used as a reference for classification (Japanese Patent Laid-Open No. 9-305505). A method in which a keyword is automatically extracted from a received mail determined to be unnecessary by the user and an unnecessary mail is determined based on the keyword (JP-A-11-15756).
Has also been proposed.

【0005】[0005]

【発明が解決しようとする課題】上記従来技術では、ま
ず最初に利用者自身が興味対象を想定して語の登録を行
わなければならないという問題があった。また、キーワ
ードを自動抽出する方式でも、キーワード抽出対象は受
信メールのみとされており、かつ要・不要を目的とした
判定のみが記載されており、利用者の興味を十分に反映
した分類はできないといった問題があった。
In the above-mentioned prior art, there is a problem that a user must first register a word on the assumption of an object of interest. Also, even in the method of automatically extracting keywords, the keyword is extracted only for received mails, and only judgments for the necessity / unnecessity are described, and classifications that sufficiently reflect the interests of users cannot be performed. There was such a problem.

【0006】本発明の目的は上記問題を解決し、送信メ
ールまたは受信メールに対して利用者の興味を反映させ
た重み付けを自動的に行うことが可能な技術を提供する
ことにある。
An object of the present invention is to solve the above-mentioned problem and to provide a technique capable of automatically weighting a sent mail or a received mail reflecting the user's interest.

【0007】[0007]

【課題を解決するための手段】本発明は、電子メールを
その重要度に応じて分類する電子メール分類装置におい
て、メール本文中から抽出された単語の組の重要度に応
じて電子メールを分類するものである。
SUMMARY OF THE INVENTION According to the present invention, there is provided an e-mail classification apparatus for classifying e-mails according to their importance, which classifies e-mails according to the importance of a set of words extracted from the mail body. Is what you do.

【0008】本発明の電子メール分類装置では、重要度
の登録対象となっている送信メールまたは受信メールの
メール本文から単語の組を抽出し、前記抽出された単語
の組に対して利用者から指定された興味度を数値化した
重要度を表す値を付与した後、前記抽出された単語の組
とその重要度を判定基準データに登録する。
[0008] In the electronic mail classification device of the present invention, a set of words is extracted from the mail body of the sent mail or the received mail whose importance is to be registered, and the extracted set of words is received from the user. After assigning a value representing the degree of importance of the designated degree of interest, the extracted word set and the degree of importance are registered in the criterion data.

【0009】次に、重要度の判定対象となっている電子
メールのメール本文から単語の組を抽出し、前記抽出さ
れた単語の組の重要度を前記判定基準データから読み出
した後、そのメール本文から抽出された各単語の組の重
要度を加算して当該電子メールに対する重要度を求め、
前記求めた重要度の値に応じて当該電子メールの重要度
の高低を表示する。
Next, a group of words is extracted from the mail body of the electronic mail whose importance is to be determined, and the importance of the extracted group of words is read from the determination criterion data. The importance of each pair of words extracted from the text is added to determine the importance of the email,
The degree of importance of the electronic mail is displayed according to the value of the obtained importance.

【0010】前記の様に本発明では、電子メールに対す
る重み付けの基準を利用者自身が作成する必要は無く、
利用者は送信メールまたは受信メールに対して、関心の
有無を指定するだけで基準の作成は自動的に行われ、こ
の基準に基づいたメールの重要度判定結果を、重要度の
高・低や数値で表示することにより、電子メールの整理
や選別等が容易に行えるものである。また、自動的に作
成された重み付けの基準は、より正確な判定を行う為、
利用者による語の登録や削除を任意に行うものとしても
良い。
As described above, in the present invention, there is no need for the user himself to create a weighting standard for the electronic mail.
The user automatically creates a criterion by simply specifying whether he or she is interested in outgoing mail or received mail, and based on this criterion, determines whether the importance of the mail is high or low, By displaying numerical values, e-mails can be easily arranged and sorted. Also, the automatically created weighting criterion is used to make more accurate judgments,
The user may arbitrarily register and delete words.

【0011】以上の様に本発明の電子メール分類装置に
よれば、メール本文中から抽出された単語の組の重要度
に応じて電子メールを分類するので、送信メールまたは
受信メールに対して利用者の興味を反映させた重み付け
を自動的に行うことが可能である。
As described above, according to the e-mail classification device of the present invention, e-mails are classified according to the importance of a set of words extracted from the main body of the mail. It is possible to automatically perform weighting reflecting the interest of the person.

【0012】[0012]

【発明の実施の形態】以下に電子メールをその重要度に
応じて分類する一実施形態の電子メール分類装置につい
て説明する。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS An electronic mail classification apparatus according to an embodiment for classifying electronic mails according to their importance will be described below.

【0013】図1は本実施形態の電子メールの自動分類
機能を利用した電子メール送受信システムの構成を示す
図である。図1に示す様に本実施形態の電子メール送受
信システムは、メール重要度登録部32と、メール重要
度判定部33とを有している。
FIG. 1 is a diagram showing a configuration of an electronic mail transmission / reception system using an electronic mail automatic classification function according to this embodiment. As shown in FIG. 1, the e-mail transmission / reception system of the present embodiment includes a mail importance registration unit 32 and a mail importance determination unit 33.

【0014】メール重要度登録部32は、重要度の登録
対象となっている電子メールのメール本文から単語の組
を抽出し、前記抽出された単語の組に対して重要度を表
す値を付与し、前記抽出された単語の組とその重要度を
判定基準データに登録する処理部である。
The mail importance registering unit 32 extracts a set of words from the mail body of the electronic mail whose importance is to be registered, and assigns a value indicating the importance to the extracted word set. Then, the processing unit registers the extracted word set and its importance in the determination reference data.

【0015】メール重要度判定部33は、重要度の判定
対象となっている電子メールのメール本文から単語の組
を抽出し、前記抽出された単語の組の重要度を前記判定
基準データから読み出し、前記読み出した重要度の値に
応じて当該電子メールを分類してその重要度の高低を表
示する処理部である。
The mail importance judging section 33 extracts a set of words from the mail text of the electronic mail whose importance is to be judged, and reads the importance of the extracted word set from the judgment reference data. A processing unit for classifying the electronic mail according to the read importance value and displaying the degree of importance.

【0016】電子メール送受信システムをメール重要度
登録部32及びメール重要度判定部33として機能させ
る為のプログラムは、CD−ROM等の記録媒体に記録
され磁気ディスク等に格納された後、メモリにロードさ
れて実行されるものとする。なお前記プログラムを記録
する記録媒体はCD−ROM以外の他の記録媒体でも良
い。また前記プログラムを当該記録媒体から情報処理装
置にインストールして使用しても良いし、ネットワーク
を通じて当該記録媒体にアクセスして前記プログラムを
使用するものとしても良い。
A program for causing the electronic mail transmission / reception system to function as the mail importance registration section 32 and the mail importance determination section 33 is recorded on a recording medium such as a CD-ROM, stored on a magnetic disk or the like, and then stored in a memory. It shall be loaded and executed. The recording medium for recording the program may be a recording medium other than the CD-ROM. The program may be installed from the recording medium to the information processing apparatus and used, or the recording medium may be accessed through a network to use the program.

【0017】本実施形態では、ネットワーク20上にサ
ーバ10、クライアント30が割り当てられている。
In this embodiment, the server 10 and the client 30 are allocated on the network 20.

【0018】サーバ10内のメールサーバ11は、ネッ
トワーク20を介してクライアント30とのメール送受
信管理を行う。クライアント30にはメール通信部3
1、メール重要度登録部32、メール重要度判定部3
3、メール蓄積部34、判定基準データ35が割り当て
られている。これとメールの内容等を表示する表示装置
40、操作を行う為の入力装置50で利用者の環境は構
成されている。
The mail server 11 in the server 10 manages mail transmission and reception with the client 30 via the network 20. The client 30 has a mail communication unit 3
1. Mail importance registration unit 32, mail importance determination unit 3
3, a mail storage unit 34, and determination reference data 35 are assigned. The user environment is constituted by the display device 40 for displaying the contents of the mail and the like, and the input device 50 for performing an operation.

【0019】メール通信部31を経由して送受信したメ
ールの情報は、メール蓄積部34に蓄えられる。このメ
ール蓄積部34内の任意のメールに対し、入力装置50
によって利用者が重要度設定の操作を行うと、メール重
要度登録部32において、指定したメールから判定基準
データを作成し、その結果を判定基準データ35に登録
する。このとき、重要度設定の操作は、メール蓄積部3
4内の1つ以上のメールに対して実行可能とし、メール
を読んでいる時、または削除する時等の様な複数のタイ
ミングでも実行が可能とする。
The mail information transmitted and received via the mail communication unit 31 is stored in the mail storage unit 34. An arbitrary mail in the mail storage unit 34 is input to the input device 50.
When the user performs an operation for setting the importance, the e-mail importance registration unit 32 creates judgment reference data from the specified e-mail, and registers the result in the judgment reference data 35. At this time, the operation for setting the importance is performed by the mail storage unit 3.
4 can be executed for one or more mails, and can be executed at a plurality of timings, such as when reading or deleting a mail.

【0020】次に、メール蓄積部34内の任意のメール
に対し、入力装置50によって利用者が重要度判定の操
作を行うと、メール重要度判定部33において、指定し
たメールに対し判定基準データ35を参照して重要度判
定を行い、表示装置40においてその結果を表示する。
このとき、重要度判定の操作は、メール蓄積部34内の
1つ以上のメールに対して実行可能とする。
Next, when the user performs an operation of judging the importance of an arbitrary mail in the mail storage unit 34 by using the input device 50, the mail importance judging unit 33 outputs the judgment reference data to the specified mail. The importance is determined with reference to 35, and the result is displayed on the display device 40.
At this time, the operation of the importance determination is executable for one or more mails in the mail storage unit 34.

【0021】図2は本実施形態のメール重要度登録部3
2の処理手順を示すフローチャートである。文書の特徴
を数値により表すには、いくつかの方法があるが、ここ
ではベクトルによる文書の表現方法を使用して実現した
場合を例として説明する。ベクトルによる文書の表現方
法とは、文中の1つの語に対し、その語と関連性のある
他の語を1つの組とし、それらが文書の特徴を示すもの
とする方法である。メール重要度登録部32は、送受信
メールから判定基準データを以下の処理によって作成す
る。
FIG. 2 shows the mail importance registering section 3 of the present embodiment.
6 is a flowchart illustrating a processing procedure of No. 2; There are several methods for expressing the characteristics of a document by numerical values. Here, a case where the method is realized by using a method of expressing a document by a vector will be described as an example. The method of expressing a document by a vector is a method in which, for one word in a sentence, another word related to the word is set as one set, and these words indicate characteristics of the document. The mail importance registering unit 32 creates determination reference data from the transmitted / received mail by the following processing.

【0022】まずステップ201でメール重要度登録部
32は、単語抽出処理部60により、メール本文から単
語を抽出する。単語の抽出には、辞書データを参照して
語を切り出す方法、文中で漢字、ひらがな等の文字種を
目印として切り出す方法等あるが、ここではその方法は
特に制限しない。
First, in step 201, the mail importance registration section 32 causes the word extraction processing section 60 to extract words from the mail body. The method of extracting words includes a method of extracting words by referring to dictionary data, a method of extracting characters using characters such as kanji and hiragana in a sentence as a mark, and the like, but the method is not particularly limited here.

【0023】次にステップ202では、単語間関係決定
処理部61により、1つの単語に対して関連のある語を
探す。ここで言う語同士の関連とは、主語と動詞、係り
受けといった日本語の文法に基づく関連を意味する。こ
れは助詞や語の意味等を基準とした、一般的な日本語解
析方法を利用することで実現可能である。
Next, in step 202, the inter-word relationship determination processing section 61 searches for a word that is related to one word. Here, the relation between words means a relation based on Japanese grammar such as a subject, a verb, and a dependency. This can be realized by using a general Japanese analysis method based on the meaning of particles, words, and the like.

【0024】次にステップ203では、重要度設定処理
部62により、単語間関係決定処理部61で抽出された
1組の語に対し、利用者がメール本文に対して指定した
興味度を数値化し、重要度を表す値として付与する。興
味度の数値化については、直接利用者が数値で指定した
値を使用するか、または高・低といった曖昧な表現で指
定したものを、「高」の際には+10、「低」の際には
−10等の所定の数値に置き換えるといった方法が考え
られる。また、重要度を示す数値に、この語の組が文中
で出現した回数を乗算する等して、それぞれの語の組に
重要度の格差を持たせることも可能である。
Next, in step 203, the degree of interest specified by the user with respect to the text of the mail is quantified by the importance setting processing unit 62 for the set of words extracted by the inter-word relation determination processing unit 61. , As a value indicating importance. Regarding the numerical value of the degree of interest, use a value specified directly by the user as a numerical value, or a value specified by an ambiguous expression such as high / low, when "high" is +10, when "low" Can be replaced with a predetermined numerical value such as -10. It is also possible to give each word set a difference in importance by multiplying the numerical value indicating the importance by the number of times this word set appears in the sentence.

【0025】次にステップ204で既存データ比較・登
録処理部63は、重要度設定処理部62で作成したデー
タと、既存の判定基準データ35とを比較し、同じ単語
の組が存在しない場合にはステップ205に進み、存在
する場合にはステップ206へ進む。
Next, at step 204, the existing data comparison / registration processing section 63 compares the data created by the importance setting processing section 62 with the existing judgment criterion data 35, and if the same word pair does not exist, Goes to step 205, and if there is, goes to step 206.

【0026】ステップ205では、重要度設定処理部6
2で作成したデータを判定基準データ35に追加し、一
方、ステップ206では、それぞれの重要度を加算また
は減算した結果を判定基準データ35に再度登録するこ
とで興味の変化を反映させる。なお本実施形態では、重
要度にマイナスの値を設定することにより減算と同等の
処理を行うものとしている。
In step 205, the importance setting processing section 6
In step 206, the data created in step 2 is added to the criterion data 35. On the other hand, in step 206, the result of adding or subtracting the respective degrees of importance is registered again in the criterion data 35 to reflect a change in interest. In the present embodiment, a process equivalent to subtraction is performed by setting a negative value to the importance.

【0027】また、判定基準データ35は上記の様な処
理手順で自動生成を行うことが可能であるが、利用者が
直接データの登録・削除、または重要度を表す数値の変
更を行うことにより、より利用者の意図に沿う基準を作
成することも可能とする。
The determination reference data 35 can be automatically generated by the above-described processing procedure. However, the user can directly register / delete the data or change the numerical value indicating the importance. It is also possible to create a standard that more closely matches the user's intention.

【0028】図3は本実施形態のメール重要度判定部3
3の処理手順を示すフローチャートである。メール重要
度判定部33では、メール重要度登録部32が生成する
判定基準データ35を参照することにより、送受信メー
ルの重要度判定を行う。
FIG. 3 shows the mail importance judging unit 3 of the present embodiment.
13 is a flowchart illustrating a processing procedure of No. 3; The mail importance determining unit 33 determines the importance of the transmitted / received mail by referring to the criterion data 35 generated by the mail importance registering unit 32.

【0029】まずステップ301でメール重要度判定部
33は、単語抽出処理部70により、指定したメール本
文から単語を抽出する。この処理は単語抽出処理部60
と同じ処理である。次にステップ302では、単語間関
係決定処理部71により、関連性のある語を組にする。
この処理は単語間関係決定処理部61と同じ処理であ
る。
First, in step 301, the mail importance determining section 33 causes the word extraction processing section 70 to extract words from the specified mail body. This processing is performed by the word extraction processing unit 60.
This is the same processing as. Next, in step 302, the inter-word relationship determination processing unit 71 forms a set of related words.
This processing is the same as the processing performed by the inter-word relationship determination processing unit 61.

【0030】次にステップ303では、重要度参照処理
部72により、単語間関係決定処理部71で作成された
単語の組を検索キーとして既存の判定基準データ35を
検索し、ステップ304では、前記検索結果の内容を調
べ、単語間関係決定処理部71で作成された単語の組が
既存の判定基準データ35に登録されている場合はステ
ップ305へ進み、登録されていない場合にはステップ
306へ進む。
Next, in step 303, the importance reference processing unit 72 searches the existing determination criterion data 35 using the word set created in the inter-word relationship determination processing unit 71 as a search key. The contents of the search result are examined, and if the word set created by the inter-word relationship determination processing unit 71 is registered in the existing determination reference data 35, the process proceeds to step 305. If not, the process proceeds to step 306. move on.

【0031】ステップ305では、判定基準データ35
内の重要度の数値を設定することで、単語間関係決定処
理部71で作成された単語の組に対して重要度の数値を
付与する。一方、ステップ306では、その単語の組に
重要度無しを示す数値を設定する。
In step 305, the criterion data 35
By setting the numerical value of the importance in the above, the numerical value of the importance is given to the set of words created by the inter-word relationship determination processing unit 71. On the other hand, in step 306, a numerical value indicating no importance is set for the word set.

【0032】ステップ307でメール重み付け計算処理
部73は、単語間関係決定処理部71で作成された全て
の単語の組に対して設定された重要度を加算すること
で、当該メールに対する重要度を算出してそのメールを
分類し、その算出された重要度の数値に応じて高/中/
低等の当該メールの重要度を示す表示を行う。
In step 307, the mail weight calculation processing unit 73 adds the importance set to all the word sets created by the inter-word relation determination processing unit 71 to determine the importance for the mail. Calculate and classify the email, and according to the calculated importance value, high / medium /
A display indicating the importance of the mail such as low is displayed.

【0033】図4は本実施形態のメール重要度登録部3
2を使用したメール重要度登録の実施画面例を示す図で
ある。メール送受信全体画面80は操作の為のボタンと
メール一覧画面から構成される。操作ボタンはメール新
規作成ボタン81、メール送受信ボタン82、メール削
除ボタン83、メール重要度判定ボタン84、メール重
要度設定ボタン85がある。メール一覧画面は受信メー
ル一覧86と送信メール一覧87がある。
FIG. 4 shows the mail importance registering section 3 of the present embodiment.
FIG. 11 is a diagram showing an example of an implementation screen of mail importance registration using No. 2; The mail transmission / reception entire screen 80 includes buttons for operation and a mail list screen. The operation buttons include a new mail creation button 81, a mail transmission / reception button 82, a mail deletion button 83, a mail importance determination button 84, and a mail importance setting button 85. The mail list screen includes a received mail list 86 and a transmitted mail list 87.

【0034】ここでは1つの受信メールに対して重要度
登録操作を行う場合の操作を説明する。まず、受信メー
ル一覧86で、対象とするメールを選択する。図では
「選択」に×印が付いたものが選択したメールである。
次に、そのメールに対する興味に応じて、メール重要度
設定ボタン85の高/低の何れかを押す。ここではメー
ルの内容に興味があるものとして「高」を押したものと
する。例では興味の度合いを高/低の何れかから選択さ
せているが、数値やグラフ等による、より詳細な指定も
可能である。
Here, the operation in the case of performing the importance registration operation for one received mail will be described. First, a target mail is selected from the received mail list 86. In the figure, the mail with the “X” mark in “Select” is the selected mail.
Next, one of high / low of the mail importance setting button 85 is pressed according to the interest in the mail. Here, it is assumed that "high" is pressed because the user is interested in the contents of the mail. In the example, the degree of interest is selected from either high or low, but more detailed designation using numerical values, graphs, or the like is also possible.

【0035】図5は本実施形態の図4のメール重要度登
録の処理概要を示す図である。ここで説明する重要度の
数値設定や計算方法は、実現方法の一例である。
FIG. 5 is a diagram showing an outline of the process of registering the mail importance of FIG. 4 of the present embodiment. The method of setting the numerical value of importance and the method of calculation described here are examples of a realization method.

【0036】まず、利用者が興味「高」を指定したメー
ル本文90から単語抽出を行い、単語抽出結果91が得
られる。次に、単語抽出結果91から関連性のある語を
組にし、これに文中での出現頻度を付与した語の組92
を生成する。「電子メール/感染」はメール本文中で2
回出現しているので、頻度が2となっている。その他の
組については1回しか出現していない為、頻度は1であ
る。
First, a word is extracted from the mail body 90 in which the user has specified interest “high”, and a word extraction result 91 is obtained. Next, a set of related words is set from the word extraction result 91, and the set of words 92 to which the appearance frequency in the sentence is added to the set.
Generate "Email / infection" is 2
Since it appears twice, the frequency is 2. The frequency is 1 since the other sets appear only once.

【0037】次に利用者が指定した興味の度合いを反映
させるが、ここでは利用者の指定は数値としては指定さ
れていない為、興味「高」の場合の値を+10として設
定する。また、ここでは重要度を出現頻度と掛ける処理
を行ったとして、語の組92の頻度と掛け合わせ、その
結果を語の組に付与した重要度設定データ93を生成す
る。
Next, the degree of interest specified by the user is reflected. Here, since the specification of the user is not specified as a numerical value, the value in the case of interest "high" is set as +10. Further, here, it is assumed that a process of multiplying the importance by the appearance frequency is performed, and the frequency is multiplied by the frequency of the word set 92, and importance setting data 93 in which the result is assigned to the word set is generated.

【0038】次に、重要度設定データ93と既存判定基
準データ94と比較し、同じ語の組がある場合は、その
重要度を加算・減算して、興味の変化を反映させた完成
判定基準データ95を生成する。例では「ウイルス/感
染」という語の組が一致しており、既存判定基準データ
94では重要度が−10、メール90から生成した重要
度設定データ93では+10の為、加算の結果「ウイル
ス/感染」の重要度は0と設定された。
Next, the importance setting data 93 is compared with the existing judgment criterion data 94, and if there is the same word set, the importance is added or subtracted, and the completion judgment criterion reflecting the change in interest is reflected. The data 95 is generated. In the example, the combination of the words “virus / infection” matches, and the importance is −10 in the existing determination criterion data 94 and +10 in the importance setting data 93 generated from the mail 90. The severity of "infection" was set to 0.

【0039】図6は本実施形態のメール重要度判定部3
3を使用したメール重要度判定の実施画面例を示す図で
ある。メール送受信全体画面100は図4と同じ画面で
あるが、ここでは送信メール一覧102の複数の送信メ
ールに対して重要度判定を行う場合の操作を説明する。
FIG. 6 shows the mail importance judging section 3 of the present embodiment.
FIG. 13 is a diagram showing an example of an implementation screen for e-mail importance determination using No. 3. The entire mail transmission / reception screen 100 is the same screen as that of FIG.

【0040】まず、送信メール一覧102で、対象とす
るメールを選択する。図では「選択」に×印が付いた状
態になっているものが対象のメールである。次に、指定
した送信メールに対する重要度を判定する為、重要度判
定ボタン101が押されると、例えば重要度が100よ
り大きい場合には「高」、100から0の間では
「中」、0未満では「低」等に判定する。ここでは判定
の結果として、高/中/低といった表示がされている
が、数値やグラフ等でより詳細に表示することも可能で
ある。
First, in the outgoing mail list 102, a target mail is selected. In the figure, the target mail is one in which "selection" is marked with a cross. Next, when the importance determination button 101 is pressed in order to determine the importance of the specified outgoing mail, for example, if the importance is greater than 100, “high”; If it is less, it is determined as “low”. Here, as a result of the determination, a display such as high / middle / low is displayed, but it is also possible to display in more detail by a numerical value, a graph, or the like.

【0041】図7は本実施形態の図6のメール重要度判
定の処理概要を示す図である。利用者が複数のメールを
指定した場合でも、判定処理は各メール毎に行う。ここ
では指定した1つのメール本文110に対し、まず単語
抽出が行われ、単語抽出結果111が得られる。
FIG. 7 is a diagram showing an outline of the processing for judging the importance of mail in FIG. 6 of the present embodiment. Even if the user specifies a plurality of mails, the determination process is performed for each mail. Here, word extraction is first performed on one specified mail body 110, and a word extraction result 111 is obtained.

【0042】次に関連性のある語を組にし、文中での出
現頻度を付与した語の組112が得られる。これを既存
判定基準データ113と比較し、同じ語の組が存在する
場合、既存判定基準データ113に設定されている重要
度の数値を参照して重要度設定データ114を生成す
る。この例では「ワクチン/検出」「感染/検出」とい
う語の組は既存判定基準データ113に存在しない。ま
た「ウイルス/感染」は存在しているが、重要度は0で
ある。この為、既存判定基準データ113に存在する
「電子メール/感染」の重要度+20のみ採用され、こ
れに頻度1をかけたものが重要度設定データ114に設
定された。
Next, a related word set 112 is obtained, and a word set 112 to which the appearance frequency in the sentence is added is obtained. This is compared with the existing determination criterion data 113, and when the same word set exists, the importance setting data 114 is generated by referring to the numerical value of the importance set in the existing determination criterion data 113. In this example, the set of the words “vaccine / detection” and “infection / detection” does not exist in the existing criterion data 113. “Virus / infection” is present, but its importance is 0. For this reason, only the importance of “e-mail / infection” existing in the existing determination reference data 113 +20 is used, and the result obtained by multiplying the frequency by 1 is set in the importance setting data 114.

【0043】重要度設定データ114の重要度を全て足
した結果を重要度115とし、この例では重要度は+2
0となった。重要度115の値を利用することで、メー
ルの重要度の高低を示すことが可能となる。
The result obtained by adding all the degrees of importance of the degree of importance setting data 114 is defined as the degree of importance 115. In this example, the degree of importance is +2.
It became 0. By using the value of the importance 115, it is possible to indicate the level of importance of the mail.

【0044】前記の様に本実施形態によれば、送受信し
た電子メールの内容を参照しなくても、利用者の興味に
応じた重要度を知ることができるので、容易にメールの
選別を行うことが可能になる。また、送受信メールから
重要度の判定基準を作成することにより、興味の移り変
わりによる重要度の変化にも対応できる。
As described above, according to the present embodiment, it is possible to know the importance according to the user's interest without referring to the contents of the transmitted and received e-mails, so that the mails can be easily sorted. It becomes possible. In addition, by creating a criterion for determining the importance from the transmitted / received mail, it is possible to cope with a change in the importance due to a change in interest.

【0045】更に本実施形態では、受信メールの重要度
だけでなく、送信メールの重要度も知ることができるの
で、送信後に送信側に残っているオリジナルの送信メー
ルを整理する際に、その重要度に応じて削除を行う等、
送信メールの整理・選別に役立てることができる。なお
送信メールで判定された重要度を当該送信メールと共に
送信先に送り、受信側での重要度として利用しても良
い。
Further, in the present embodiment, not only the importance of the received mail but also the importance of the transmitted mail can be known. Deletion depending on the degree, etc.
Useful for organizing and sorting outgoing mail. The importance determined in the transmitted mail may be sent to the destination together with the transmitted mail, and may be used as the importance on the receiving side.

【0046】以上説明した様に本実施形態の電子メール
分類装置によれば、メール本文中から抽出された単語の
組の重要度に応じて電子メールを分類するので、送信メ
ールまたは受信メールに対して利用者の興味を反映させ
た重み付けを自動的に行うことが可能である。
As described above, according to the e-mail classification device of the present embodiment, e-mails are classified according to the importance of a set of words extracted from the main body of the mail. It is possible to automatically perform weighting reflecting the interest of the user.

【0047】[0047]

【発明の効果】本発明によればメール本文中から抽出さ
れた単語の組の重要度に応じて電子メールを分類するの
で、送信メールまたは受信メールに対して利用者の興味
を反映させた重み付けを自動的に行うことが可能であ
る。
According to the present invention, e-mails are classified according to the importance of a set of words extracted from the main body of the mail. Therefore, weighting that reflects the user's interest in outgoing mail or received mail is performed. Can be performed automatically.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本実施形態の電子メールの自動分類機能を利用
した電子メール送受信システムの構成を示す図である。
FIG. 1 is a diagram showing a configuration of an e-mail transmission / reception system using an automatic e-mail classification function according to an embodiment.

【図2】本実施形態のメール重要度登録部32の処理手
順を示すフローチャートである。
FIG. 2 is a flowchart showing a processing procedure of a mail importance registration unit 32 of the embodiment.

【図3】本実施形態のメール重要度判定部33の処理手
順を示すフローチャートである。
FIG. 3 is a flowchart showing a processing procedure of a mail importance determining unit 33 of the embodiment.

【図4】本実施形態のメール重要度登録部32を使用し
たメール重要度登録の実施画面例を示す図である。
FIG. 4 is a diagram illustrating an example of a screen for performing mail importance registration using the mail importance registration unit 32 according to the embodiment.

【図5】本実施形態の図4のメール重要度登録の処理概
要を示す図である。
FIG. 5 is a diagram showing an outline of processing for registering the mail importance of FIG. 4 in the embodiment.

【図6】本実施形態のメール重要度判定部33を使用し
たメール重要度判定の実施画面例を示す図である。
FIG. 6 is a diagram illustrating an example of a screen for performing a mail importance determination using the mail importance determination unit 33 according to the embodiment.

【図7】本実施形態の図6のメール重要度判定の処理概
要を示す図である。
FIG. 7 is a diagram showing an outline of a process of judging the mail importance of FIG. 6 according to the embodiment;

【符号の説明】[Explanation of symbols]

10…サーバ、11…メールサーバ、20…ネットワー
ク、30…クライアント、31…メール通信部、34…
メール蓄積部、35…判定基準データ、40…表示装
置、50…入力装置、60…単語抽出処理部、61…単
語間関係決定処理部、62…重要度設定処理部、63…
既存データ比較・登録処理部、70…単語抽出処理部、
71…単語間関係決定処理部、72…重要度参照処理
部、73…メール重み付け計算処理部、32…メール重
要度登録部、33…メール重要度判定部、80…メール
送受信全体画面、81…メール新規作成ボタン、82…
メール送受信ボタン、83…メール削除ボタン、84…
メール重要度判定ボタン、85…メール重要度設定ボタ
ン、86…受信メール一覧、87…送信メール一覧、9
0…メール本文、91…単語抽出結果、92…語の組、
93…重要度設定データ、94…既存判定基準データ、
95…完成判定基準データ、100…メール送受信全体
画面、101…重要度判定ボタン、102…送信メール
一覧、110…メール本文、111…単語抽出結果、1
12…語の組、113…既存判定基準データ、114…
重要度設定データ、115…重要度。
10 server, 11 mail server, 20 network, 30 client, 31 mail communication unit, 34
E-mail storage unit, 35... Determination reference data, 40... Display device, 50... Input device, 60.
Existing data comparison / registration processing unit, 70 ... word extraction processing unit,
71: Inter-word relationship determination processing unit, 72: Importance reference processing unit, 73: E-mail weight calculation processing unit, 32: E-mail importance registration unit, 33: E-mail importance determination unit, 80: E-mail transmission / reception entire screen, 81 ... New mail button, 82 ...
Email send / receive button, 83 ... Email delete button, 84 ...
Mail importance judgment button, 85: Mail importance setting button, 86: Received mail list, 87: Sent mail list, 9
0: mail text, 91: word extraction result, 92: word set,
93 ... importance setting data, 94 ... existing judgment reference data,
95: Completion judgment reference data, 100: Mail transmission / reception entire screen, 101: Importance judgment button, 102: Outgoing mail list, 110: Mail text, 111: Word extraction result, 1
12 ... word set, 113 ... existing criterion data, 114 ...
Importance setting data, 115 ... Importance.

Claims (5)

【特許請求の範囲】[Claims] 【請求項1】 電子メールをその重要度に応じて分類す
る電子メール分類方法において、 重要度の登録対象となっている電子メールのメール本文
から単語の組を抽出するステップと、前記抽出された単
語の組に対して重要度を表す値を付与するステップと、
前記抽出された単語の組とその重要度を判定基準データ
に登録するステップと、 重要度の判定対象となっている電子メールのメール本文
から単語の組を抽出するステップと、前記抽出された単
語の組の重要度を前記判定基準データから読み出すステ
ップと、前記読み出した重要度の値に応じて当該電子メ
ールを分類するステップとを有することを特徴とする電
子メール分類方法。
1. An e-mail classification method for classifying e-mails according to their importance, a step of extracting a set of words from an e-mail body of the e-mail whose importance is to be registered, Assigning a value indicating importance to the set of words;
Registering the extracted word set and its importance in the criterion data; extracting the word set from the mail body of the electronic mail whose importance is to be determined; A step of reading the importance of the set from the determination criterion data, and a step of classifying the electronic mail according to the read value of the importance.
【請求項2】 利用者から入力された重要度を前記判定
基準データに設定することを特徴とする請求項1に記載
された電子メール分類方法。
2. The method according to claim 1, wherein a degree of importance input by a user is set in the criterion data.
【請求項3】 前記読み出した重要度の値に応じて当該
電子メールの重要度の高低を表示することを特徴とする
請求項1または請求項2のいずれかに記載された電子メ
ール分類方法。
3. The method according to claim 1, wherein the degree of importance of the electronic mail is displayed according to the read value of the importance.
【請求項4】 電子メールをその重要度に応じて分類す
る電子メール分類装置において、 重要度の登録対象となっている電子メールのメール本文
から単語の組を抽出し、前記抽出された単語の組に対し
て重要度を表す値を付与し、前記抽出された単語の組と
その重要度を判定基準データに登録するメール重要度登
録部と、 重要度の判定対象となっている電子メールのメール本文
から単語の組を抽出し、前記抽出された単語の組の重要
度を前記判定基準データから読み出し、前記読み出した
重要度の値に応じて当該電子メールの重要度の高低を表
示するメール重要度判定部とを備えることを特徴とする
電子メール分類装置。
4. An electronic mail classification device for classifying electronic mails according to their importance, extracting a set of words from the mail body of the electronic mail whose importance is to be registered, and A mail importance registering unit for assigning a value indicating importance to the group and registering the extracted word group and its importance in the determination reference data; and A mail that extracts a set of words from a mail body, reads the importance of the extracted set of words from the determination criterion data, and displays the level of importance of the electronic mail according to the read value of the importance. An e-mail classification device, comprising: an importance determination unit.
【請求項5】 電子メールをその重要度に応じて分類す
る電子メール分類装置としてコンピュータを機能させる
為のプログラムにおいて、 重要度の登録対象となっている電子メールのメール本文
から単語の組を抽出し、前記抽出された単語の組に対し
て重要度を表す値を付与し、前記抽出された単語の組と
その重要度を判定基準データに登録するメール重要度登
録部と、 重要度の判定対象となっている電子メールのメール本文
から単語の組を抽出し、前記抽出された単語の組の重要
度を前記判定基準データから読み出し、前記読み出した
重要度の値に応じて当該電子メールの重要度の高低を表
示するメール重要度判定部としてコンピュータを機能さ
せることを特徴とするプログラム。
5. A program for causing a computer to function as an e-mail classification device for classifying e-mails according to their importance, wherein a set of words is extracted from the e-mail body of the e-mail whose importance is to be registered. A mail importance registering unit that assigns a value indicating importance to the extracted word set, and registers the extracted word set and its importance in determination reference data; A set of words is extracted from the mail body of the target e-mail, the importance of the extracted set of words is read from the determination criterion data, and the value of the e-mail is read in accordance with the read value of the importance. A program for causing a computer to function as a mail importance determining unit that displays the level of importance.
JP2001140820A 2001-05-11 2001-05-11 E-mail classification method, its implementation device and its processing program Pending JP2002334045A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001140820A JP2002334045A (en) 2001-05-11 2001-05-11 E-mail classification method, its implementation device and its processing program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001140820A JP2002334045A (en) 2001-05-11 2001-05-11 E-mail classification method, its implementation device and its processing program

Publications (1)

Publication Number Publication Date
JP2002334045A true JP2002334045A (en) 2002-11-22

Family

ID=18987355

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001140820A Pending JP2002334045A (en) 2001-05-11 2001-05-11 E-mail classification method, its implementation device and its processing program

Country Status (1)

Country Link
JP (1) JP2002334045A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100737853B1 (en) 2005-03-11 2007-07-12 인하대학교 산학협력단 Email classification system and method
JP2009512082A (en) * 2005-10-21 2009-03-19 ボックスセントリー ピーティーイー リミテッド Electronic message authentication
WO2012008655A1 (en) * 2010-07-12 2012-01-19 한국과학기술정보연구원 Document browsing device and method having dynamic threshold
JP2015082179A (en) * 2013-10-22 2015-04-27 株式会社日立ハイテクノロジーズ Analysis device information system, analysis device, and user terminal

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100737853B1 (en) 2005-03-11 2007-07-12 인하대학교 산학협력단 Email classification system and method
JP2009512082A (en) * 2005-10-21 2009-03-19 ボックスセントリー ピーティーイー リミテッド Electronic message authentication
WO2012008655A1 (en) * 2010-07-12 2012-01-19 한국과학기술정보연구원 Document browsing device and method having dynamic threshold
JP2015082179A (en) * 2013-10-22 2015-04-27 株式会社日立ハイテクノロジーズ Analysis device information system, analysis device, and user terminal

Similar Documents

Publication Publication Date Title
KR101708508B1 (en) Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction
CN109657054B (en) Abstract generation method, device, server and storage medium
CN107609101B (en) Intelligent interaction method, equipment and storage medium
KR100544514B1 (en) Method and system for determining search query relevance
US6199103B1 (en) Electronic mail determination method and system and storage medium
US9032031B2 (en) Apparatus, method and computer program product for processing email, and apparatus for searching email
EP2187334A1 (en) Information providing support device and information providing support method
US9519704B2 (en) Real time single-sweep detection of key words and content analysis
JP2003223456A (en) Method and device for automatic summary evaluation and processing, and program therefor
US20040158558A1 (en) Information processor and program for implementing information processor
JP7180767B2 (en) Response processing program, response processing method, and information processing device
JPH1145284A (en) Computer-readable recording medium recording a program for causing a computer to execute a method of creating a profile and each step of the method
JP2003067304A (en) E-mail filtering system, e-mail filtering method, e-mail filtering program, and recording medium recording the same
JP2008033687A (en) Search query creation device
JPH11120183A (en) Keyword extraction method and device
JP4920471B2 (en) Mail data classification device, mail data classification program, and mail data classification method
CN102890690A (en) Target information search method and device
CN109815320B (en) Answer generation method, device, equipment and storage medium of question-answering system
JP2011090463A (en) Document retrieval system, information processing apparatus, and program
CN113849688B (en) Resource processing method, resource processing device, electronic device and storage medium
JP2002334045A (en) E-mail classification method, its implementation device and its processing program
US20120158773A1 (en) Method, system and computer program product for activating information of object computer system
JP2007140721A (en) Document specialization acquisition program
JPH1115848A (en) Information classification apparatus, document information classification method, and recording medium used to execute the method
CN108427769B (en) A method for extracting people's interest tags based on social network