[go: up one dir, main page]

JP2009037346A - Unwanted e-mail exclusion system - Google Patents

Unwanted e-mail exclusion system Download PDF

Info

Publication number
JP2009037346A
JP2009037346A JP2007199879A JP2007199879A JP2009037346A JP 2009037346 A JP2009037346 A JP 2009037346A JP 2007199879 A JP2007199879 A JP 2007199879A JP 2007199879 A JP2007199879 A JP 2007199879A JP 2009037346 A JP2009037346 A JP 2009037346A
Authority
JP
Japan
Prior art keywords
spam
mail
log
received
received mail
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2007199879A
Other languages
Japanese (ja)
Inventor
Takeo Arima
猛夫 有馬
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEXTVISION CO Ltd
Original Assignee
NEXTVISION CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEXTVISION CO Ltd filed Critical NEXTVISION CO Ltd
Priority to JP2007199879A priority Critical patent/JP2009037346A/en
Publication of JP2009037346A publication Critical patent/JP2009037346A/en
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Transfer Between Computers (AREA)

Abstract

<P>PROBLEM TO BE SOLVED: To solve the problem that since only a mail manager manages a database in which a keyword as a criterion of the unwanted e-mail is stored in the conventional unwanted e-mail exclusion system, it is necessary for each receiver to request a mail manager to register information in the database each time receiving the unwanted e-mail. <P>SOLUTION: A data repeater system 3 for enabling an enterprise share information of electronic mail to be relayed between an Internet server 1 and terminal equipment 2 inside the enterprise is installed. The plurality of words/phrases of the reception mail are compared with SPAM probability calculated from the degree of appearance of each word/phrase of a SPAM information management database 4 so that the SPAM/non-SPAM of the reception mail can be determined by a reception mail decision means 32, and the reception mail is classified into each log. When the reception mail is not correctly classified due to erroneous determination, each receiver is made to correctly classify and learn the reception mail by using a spam registration means 34a and a spam registration releasing means 34b. Thus, it is possible to improve the spam decision precision by the user inside the enterprise. <P>COPYRIGHT: (C)2009,JPO&INPIT

Description

本発明は、インターネットサーバと企業内部の端末機との間にデータ中継装置を設置して中継した電子メールのログを共有し、受信メールと共有する電子メールより抽出した字句から受信メールのスパム確率度を算出してスパム・非スパムを判定し、各受信者にとって誤判定の場合には各受信者で正しく分類して学習させることで判定精度を高めてゆく迷惑メール排除システムに関する。   The present invention is to install a data relay device between an Internet server and a company internal terminal to share a log of relayed e-mail, and receive the spam probability of the received mail from the lexical extracted from the e-mail shared with the received mail The present invention relates to a junk e-mail elimination system that determines the degree of spam / non-spam by calculating the degree of error, and in the case of erroneous determination for each recipient, corrects the classification by each recipient and learns it.

従来の迷惑メールの排除方法には、迷惑メールを判定するためのキーワードやアドレスを登録した辞書をメール管理者のみに管理させる方法や、電子メールに含まれる単語を用いてスパムメールを排除する方法がある。   Conventional spam e-mail elimination methods include a method in which only a mail administrator manages a dictionary in which keywords and addresses for determining junk e-mail are registered, and a method for eliminating spam e-mails using words contained in e-mails There is.

特許文献1には、データベースに着信拒否をするメールの判断基準となるキーワードの登録・参照・削除を行う権限をメール管理者のみが有し、受信したメールに登録されたキーワードが含まれている場合には該受信したメールを破棄して配信しない技術が開示されている。特許文献1の迷惑メールの排除方法は、迷惑メール着信拒否契約の契約者のアドレスと迷惑メールの判断基準となるキーワードを格納するデータベースと、迷惑メール着信拒否契約の契約者のアドレスを格納する契約者情報登録機能手段と、外部からの受信メールの送信先アドレスが前記データベースに登録されている場合には当該データベースに格納されているキーワードが含まれているかを判断し、含まれている場合には当該受信メールを破棄し、含まれていない場合にはシステム装置内又はメールスプーラに格納するメール着信拒否・許可機能手段と、前記データベースに登録されたキーワードを参照させるキーワード参照機能手段と、前記データベースにキーワードを登録するキーワード登録機能手段と、前記データベースの登録済みキーワードを削除するキーワード削除機能手段とを有するものである。   In Patent Document 1, only a mail administrator has the authority to register, refer to, and delete a keyword that is a determination criterion for mail that rejects incoming calls in a database, and includes a keyword registered in a received mail. In this case, a technique is disclosed in which the received mail is discarded and not delivered. The method for eliminating junk e-mail disclosed in Patent Document 1 includes a database that stores the address of a subscriber of a junk e-mail incoming rejection contract and a keyword that is a criterion for determining junk e-mail, and a contract that stores the address of a junk mail incoming rejection contract. When the person information registration function means and the transmission destination address of the received mail from the outside are registered in the database, it is determined whether or not the keyword stored in the database is included. Cancels the received mail, and if it is not included, the mail incoming rejection / permission function means for storing in the system device or the mail spooler, the keyword reference function means for referring to the keyword registered in the database, Keyword registration function means for registering a keyword in a database, and registration of the database Those having a keyword delete function means that you want to delete the keyword.

また、特許文献2には、判別対象の電子メールに含まれた各単語のうち、単語のスパム・非スパムの傾向を登録したデータベースにその単語がある場合には単語傾向情報を検出し、データベースに未登録の場合には非スパム傾向を有する単語として単語傾向情報を付与して、該電子メールがスパムメールか否かを判別する技術が開示されている。特許文献2の迷惑メールの排除方法は、単語がスパム・非スパムの傾向を有するか、およびこの傾向の大きさを単語傾向情報として単語ごとに保持する単語傾向情報保持部と、判別対象の電子メールを取得するメール取得部と、該電子メールに含まれる単語を抽出する単語抽出部と、前記単語傾向情報保持部に登録されている単語についてはその単語傾向情報を検出する一方、未登録単語については非スパムの傾向を有する単語として単語傾向情報を付与する単語傾向情報取得部と、電子メールから抽出された単語の単語傾向情報からスパムメールであるか否かを判別する判別部とを有するものである。
特開2004−133508号公報 特開2007−122148号公報
Further, Patent Document 2 detects word tendency information when there is a word in a database in which the spam / non-spam tendency of the word is registered among the words included in the e-mail to be discriminated. Discloses a technique for determining whether or not the e-mail is a spam mail by adding word tendency information as a word having a non-spam tendency when the e-mail is not registered. The method of eliminating junk e-mails in Patent Literature 2 includes a word tendency information holding unit that holds whether a word has a tendency of spam / non-spam, and the magnitude of this tendency as word tendency information for each word; An email acquisition unit that acquires email, a word extraction unit that extracts words included in the email, and a word tendency information for words registered in the word tendency information holding unit, while detecting unregistered words Has a word tendency information acquisition unit that gives word tendency information as a word having a non-spam tendency, and a determination unit that determines whether the word is spam mail from the word tendency information of a word extracted from an e-mail Is.
JP 2004-133508 A JP 2007-122148 A

しかしながら、上記の如く従来の迷惑メール排除システムでは、迷惑メールの判断基準となるキーワードを格納するデータベースへの登録や削除の権限はメール管理者のみに限られていた為、各受信者は迷惑メールを受信する都度メール管理者にその情報を伝えて該データベースに登録してもらう必要があった。そのため、メール管理者による登録・削除の処理が漏れた場合や各受信者によるメール管理者への連絡が漏れた場合には、同じ迷惑メールが排除されずに各受信者の元に配信され続けることや、またメール管理者による作業に遅延が生じた場合には、各受信者が依頼をしてから迷惑メール排除の反映までに時間を要する問題点があった。そして、迷惑メールと判別された受信メールはメールスプーラに格納されずに破棄されるため、各受信者は該受信メールの存在を知ることや、後から該受信メールの内容を確認することが出来ない問題点もあった。   However, as described above, in the conventional spam mail rejection system, the authority to register or delete the keyword that is the criterion for judging spam mail is limited to only the mail administrator. Each time a message is received, it is necessary to convey the information to the mail manager and register it in the database. For this reason, if the registration / deletion process by the email administrator is omitted, or if the contact of each recipient to the email administrator is leaked, the same spam mail is not excluded and continues to be delivered to each recipient. In addition, when a delay occurs in the work by the mail manager, there is a problem that it takes time until each receiver receives a request and reflection of spam mail is reflected. Since the received mail determined to be junk mail is discarded without being stored in the mail spooler, each recipient can know the existence of the received mail and confirm the contents of the received mail later. There were no problems.

また、受信メールに含まれる単語が単語のスパム・非スパムの傾向を登録したデータベースに未登録の場合には、該単語に非スパム傾向の単語傾向情報を付与してスパムメールであるか否かを判別するため、判別時の誤検出は軽減される一方で、検出漏れが増加する問題点もあった。   In addition, if the word contained in the received mail is not registered in the database in which the word spam / non-spam tendency is registered, whether the word is spam mail by adding word tendency information of non-spam tendency to the word. Therefore, there is a problem that detection errors increase while detection errors are reduced.

本発明は、上述した問題点に鑑みて為されたものであり、インターネットサーバと企業内部の端末機との間にデータ中継装置を設置し、前記データ中継装置を中継した全ての電子メールの情報をログに記録して前記企業内部の端末機で共有し、中継した前記電子メールのうち迷惑メールの受信を排除する迷惑メール排除システムにおいて、既に共有している前記電子メールあるいは前記データ中継装置を中継した受信メールのヘッダ及び本文から出現する各字句を抽出する字句抽出手段と、共有している前記電子メールのログを示したログ識別情報と、前記字句抽出手段により前記ログ識別情報に対応する前記電子メールから抽出された各字句と、前記抽出された各字句が迷惑メールを保存するスパムログ及び非迷惑メールを保存する受信ログに出現する出現度合いとを管理するスパム情報管理データベースと、前記企業内部の端末機にそれぞれ宛てられた前記受信メールから前記字句抽出手段により抽出した複数の字句と、前記スパム情報管理データベースの前記出現度合いから算出した各字句のスパム確率度とを比較して、前記受信メールのスパム確率度を算出することにより、前記受信メールのスパム・非スパムを判定する受信メール判定手段と、判定結果に基づいて前記スパムログあるいは前記受信ログへ前記受信メールを分類する受信メール分類手段と、各受信者の意に反した前記判定結果により前記スパムログあるいは前記受信ログへ分類された前記受信メールに対し、前記企業内部の端末機から前記各受信者の判断によりスパム・非スパムの指示が直接為され、前記受信メール判定手段のスパム・非スパムの判定精度を高める学習手段とで構成されることで解決するものである。   The present invention has been made in view of the above-mentioned problems, and a data relay device is installed between an Internet server and a terminal in a company, and information on all electronic mail relayed by the data relay device. In the junk mail rejection system that eliminates the reception of junk e-mail among the relayed e-mails, the e-mail or the data relay device already shared Corresponding to the log identification information by the lexical extraction means for extracting each lexical word appearing from the header and body of the relayed received mail, the log identification information indicating the log of the shared electronic mail, and the lexical extraction means Each lexical word extracted from the e-mail, and each extracted lexical word contains a spam log for storing junk mail and a reception log for storing non-spam mail. A spam information management database for managing the appearance degree appearing in a plurality of words, a plurality of words extracted by the word extraction means from the received mail addressed to each terminal in the company, and the appearance of the spam information management database The received mail determining means for determining spam / non-spam of the received mail by calculating the spam probability of the received mail by comparing the spam probability of each lexical word calculated from the degree, and based on the determination result The received mail classification means for classifying the received mail into the spam log or the received log, and the received mail classified into the spam log or the received log according to the determination result against each recipient's will, Spam / non-spam instructions are directly given by the recipient's judgment from the terminal inside the company, It solves by being constituted by a learning means for increasing the spam and non-spam determination accuracy of Shin-email determining unit.

また、本発明では、前記学習手段は、前記受信メール判定手段の非迷惑メールとの判定結果により前記受信ログに分類されるが、前記各受信者により迷惑メールと判断された前記受信メールに対し、前記各受信者の指示により前記受信ログの一覧あるいは前記受信メールの本文の画面に設けたスパム登録ボタンが1クリックされると、前記スパム情報管理データベースへ前記ログ識別情報、前記抽出された各字句及び前記出現度合いを登録すると共に、前記受信メールを前記受信ログから前記スパムログへ移動するスパム登録手段を備えることを特徴とする。   In the present invention, the learning means is classified into the reception log based on the determination result of the received mail determination means as non-spam mail, but the received mail is determined to be spam mail by each recipient. When a spam registration button provided on the list of received logs or the body text screen of the received mail is clicked once by an instruction of each recipient, the log identification information and each extracted A spam registration unit is provided for registering a lexical phrase and the appearance degree and moving the received mail from the reception log to the spam log.

更に、本発明では、前記学習手段は、前記受信メール判定手段の迷惑メールとの判定結果により前記スパムログに分類されるが、前記各受信者により非迷惑メールと判断された前記受信メールに対し、前記各受信者の指示により前記スパムログの一覧あるいは前記受信メールの本文の画面に設けたスパム除外ボタンが1クリックされると、前記スパム情報管理データベースに登録された前記ログ識別情報、前記抽出された各字句及び前記出現度合いを除外すると共に、前記受信メールを前記スパムログから前記受信ログへ移動するスパム登録解除手段を備えることを特徴とする。   Furthermore, in the present invention, the learning means is classified into the spam log according to the determination result of the received mail determining means as spam mail, but the received mail is determined as non-spam mail by each recipient. When the spam exclusion button provided on the spam log list or the received mail text screen is clicked once by the instruction of each recipient, the log identification information registered in the spam information management database, the extraction And a spam deregistration means for moving the received mail from the spam log to the reception log.

上述したように、本発明の迷惑メール排除システムでは、インターネットサーバと企業内部の端末機との間に電子メールのログを企業内部で共有するデータ中継装置を設置し、中継した受信メールから出現する各字句を抽出して、抽出した受信メールの複数の字句と共有している各電子メールのスパム確率の情報を管理するスパム情報管理データベース中の各字句の出現度合いから算出したスパム確率度とを比較し、受信メールの複数の字句のスパム確率度からスパム・非スパムを判定してスパムログあるいは受信ログへ分類する。各受信者の意に反して分類された受信メールに対しては、各受信者よりスパム・非スパムの指示が直接為され、スパム・非スパムの判定精度が高められる。これにより、迷惑メールの判断基準となるデータベースの管理権限を持つメール管理者を特別に設ける必要は無く、企業内部の各ユーザがスパム登録及びスパム解除を各人で行うことにより、各ユーザで迷惑メールの判断基準となるデータベースを管理することができるので、各ユーザの処理の内容が企業内部の全ユーザに反映される。そして、各ユーザがスパム登録及びスパム解除を直接できるので、スパム・非スパムの判定に反映されるまでの時間を大幅に短縮でき、迷惑メールの判断基準となるデータベースの各字句の出現度合いもユーザ全員で学習させることができる。   As described above, in the spam mail rejection system of the present invention, a data relay device that shares an electronic mail log inside the company is installed between the Internet server and the terminal in the company, and appears from the relayed received mail. The spam probability calculated from the appearance degree of each lexical in the spam information management database that extracts each lexical phrase and manages the spam probability information of each e-mail shared with a plurality of lexical words of the received received mail. In comparison, spam / non-spam is determined from spam probabilities of a plurality of lexical characters of received mail and classified into spam logs or received logs. With respect to the received mail classified against each recipient's will, spam / non-spam instructions are directly given by each recipient, and the accuracy of determination of spam / non-spam is improved. As a result, there is no need to set up a special email administrator who has the authority to manage the database that is used to determine spam, and each user within the company performs spam registration and release of spam. Since it is possible to manage a database that is a criterion for e-mail, the contents of each user's processing are reflected in all users in the company. And since each user can register and cancel spam directly, the time until it is reflected in the determination of spam / non-spam can be greatly shortened, and the degree of appearance of each lexical in the database, which is the judgment criterion for spam, is also the user. Everyone can learn.

更に、データ中継装置で中継した全ての電子メールを企業内部の複数のユーザで共有するので、各受信者以外のユーザであっても当該受信者の電子メールを読むことができ、受信ログ中にある迷惑メールやスパムログ中にある非迷惑メールを発見した場合は、各受信者あるいは当該受信者以外のユーザによりスパム登録及びスパム解除のボタンが押下されて、スパム登録手段及びスパム登録解除手段の処理が起動される。これにより、企業内部の全てのユーザがスパム・非スパムを管理できるのでメール管理者が不要の迷惑メール排除システムが実現できる。尚、ここでいう「共有」とは、全てのユーザが中継した全ての電子メールを共有する状態に限らず、共有範囲あるいは監視範囲が各ユーザあるいは各部門毎に設定されている状態も含む。後者の場合には、各ユーザが閲覧可能な範囲において他人の電子メールをスパム登録したり、スパム解除することができる。   Furthermore, since all the emails relayed by the data relay device are shared by a plurality of users inside the company, even users other than each recipient can read the emails of the recipients in the reception log. When a certain spam mail or non-spam mail is found in the spam log, the spam registration and spam cancellation buttons are pressed by each recipient or a user other than the recipient, and the spam registration means and spam registration cancellation means Processing is started. As a result, all users in the company can manage spam and non-spam, so that a spam mail eliminating system that does not require a mail manager can be realized. Note that “sharing” here is not limited to a state in which all emails relayed by all users are shared, but also includes a state in which a sharing range or a monitoring range is set for each user or each department. In the latter case, other users' e-mails can be registered as spam or released as long as each user can browse.

また、本発明によれば、各受信者には迷惑メールであるが、受信メール判定手段により非迷惑メールと判定され受信ログに分類された受信メールに対し、各受信者の判断で受信ログの一覧あるいは受信メールの本文画面に設けられたスパム登録ボタンを1クリックすることで、スパム情報管理データベースに各情報を登録すると共に、受信メールをスパムログへ移動する。これにより、受信メール判定手段の検出漏れによる誤判別を修正する。そして、受信ログの一覧から複数の迷惑メールを選択して一度にスパム登録をすることもできる。   Also, according to the present invention, each recipient is a junk mail, but the received mail is determined to be a non-spam mail by the received mail judging means and classified into the reception log. By clicking a spam registration button provided on the list or the received mail text screen, each information is registered in the spam information management database and the received mail is moved to the spam log. This corrects erroneous discrimination due to omission of detection by the received mail determination means. It is also possible to select a plurality of spam mails from the received log list and register spam at a time.

更に、本発明によれば、各受信者には非迷惑メールであるが、受信メール判定手段により迷惑メールと判定されスパムログに分類された受信メールに対し、各受信者の判断でスパムログの一覧あるいは受信メールの本文画面に設けられたスパム除外ボタンを1クリックすることで、スパム情報管理データベースの各情報を除外すると共に、受信メールを受信ログへ移動する。これにより、受信メール判定手段の誤検出による誤判定を修正できる。そして、スパムログの一覧から複数の非迷惑メールを選択して一度にスパム除外をすることもできる。   Furthermore, according to the present invention, each recipient is a non-spam mail, but the received mail is judged to be a spam mail by the received mail judging means and classified into the spam log. By clicking one button on the spam exclusion button provided on the list or the received mail text screen, each information in the spam information management database is excluded and the received mail is moved to the reception log. Thereby, the erroneous determination due to the erroneous detection of the received mail determination means can be corrected. You can also select multiple non-spam emails from the spam log list to exclude spam at once.

更に、データ中継装置を中継した全電子メールの情報に対し全ユーザでスパム・非スパムの判定精度を学習させることにより、スパム情報管理データベースの各字句の出現度合いの基となる電子メールが増加する。これにより、各字句の出現度合いから算出するスパム確率度の精度が向上し、スパム情報管理データベースへの未登録単語が減少し、スパム・非スパムの判定時の誤検出及び検出漏れの双方による誤判定を大幅に軽減できる。   Furthermore, by learning the accuracy of spam / non-spam determination for all users of the information of all emails relayed through the data relay device, the number of emails that are the basis for the occurrence of each word in the spam information management database increases. . This improves the accuracy of the spam probability calculated from the appearance level of each lexical word, reduces the number of unregistered words in the spam information management database, and causes errors due to both false detection and missed detection when determining spam / non-spam. Judgment can be greatly reduced.

更に、受信メール判定手段によりスパムと判定された受信メール及びスパム登録手段によりスパム登録された受信メールをスパムログへ保存することにより、迷惑メールをデータ中継装置上から破棄せずに残すことができ、誤判定によりスパムログへ保存された受信メールを各ユーザは後から確認することもできる。   Furthermore, by storing the received mail determined as spam by the received mail determining means and the received mail registered as spam by the spam registering means in the spam log, it is possible to leave unsolicited mail without discarding it from the data relay device. In addition, each user can check the received mail stored in the spam log due to the erroneous determination later.

更に、データ中継装置に中継した全電子メールの情報をログとして記録することにより、受信者の端末機から削除してしまった電子メールであってもデータ中継装置で参照することができ、該電子メールに対しスパム登録及びスパム登録解除の処理をすることができる。   Furthermore, by recording the information of all electronic mail relayed to the data relay apparatus as a log, even the electronic mail deleted from the recipient terminal can be referred to by the data relay apparatus. It is possible to process spam registration and spam registration for mail.

以下に、本発明における実施の形態について、図1乃至図4を参照にして詳細に説明する。   Hereinafter, embodiments of the present invention will be described in detail with reference to FIGS. 1 to 4.

まず、図1(A)に本発明の迷惑メール排除システムの構成図、図1(B)に本発明のスパム情報管理データベースを説明する図を示す。   First, FIG. 1A shows a configuration diagram of the spam mail rejection system of the present invention, and FIG. 1B shows a diagram for explaining a spam information management database of the present invention.

図1(A)に示す如く、本発明の迷惑メール排除システムは、企業外部のプロバイダや企業内部に設置されたインターネットサーバ1と、インターネットサーバ1にインターネットを介して接続された企業内部の端末機2と、インターネットサーバ1と端末機2との間に設置されたデータ中継装置3とから構成される。   As shown in FIG. 1A, a spam mail rejection system according to the present invention includes an Internet server 1 installed inside a provider outside the company or inside the company, and a terminal inside the company connected to the Internet server 1 via the Internet. 2 and a data relay device 3 installed between the Internet server 1 and the terminal 2.

インターネットサーバ1は、企業外部のプロバイダや企業内部に設置されていて、クライアントコンピュータに対し、自身の持っている機能やデータを提供するコンピュータである。具体的にはメールサーバであり、メールサーバ1はインターネット上に常に接続され、自ネットワーク内におけるユーザの電子メールの送信や受信を行うコンピュータである。   The Internet server 1 is a computer that is installed inside a provider outside the company or inside the company, and provides the client computer with its own functions and data. Specifically, it is a mail server, and the mail server 1 is a computer that is always connected to the Internet and transmits and receives a user's e-mail in its own network.

端末機2は、インターネットに接続され、電子メールを送受信できる企業内部に設置されたコンピュータである。企業内部の端末機2間はLANで接続され、社外のネットワークとはルータ(図示せず)を経由してデータを中継している。   The terminal 2 is a computer installed in a company that is connected to the Internet and can send and receive electronic mail. Terminals 2 in the company are connected by a LAN, and data is relayed to / from an external network via a router (not shown).

データ中継装置3は、企業外部のプロバイダのメールサーバ1へ企業内部のデータを中継するルータと端末機2との間や、企業内部のメールサーバ1と端末機2との間に設置され、メールサーバ1と端末機2との間で送受信される電子メールを中継し、中継した電子メールの情報を履歴情報としてログに記録する装置であり、企業外部あるいは企業内部のメールサーバ(インターネットサーバ)1の設定にほぼ影響することなく、データ中継装置3単独で投入できる。データ中継装置3は、スパム情報管理データベース4と、字句抽出手段31と、受信メール判定手段32と、受信メール分類手段33と、学習手段34とから構成される。   The data relay device 3 is installed between a router that relays internal data to the mail server 1 of a provider outside the enterprise and the terminal 2, or between the mail server 1 and the terminal 2 inside the enterprise, A device that relays electronic mail transmitted and received between the server 1 and the terminal 2 and records the relayed electronic mail information in a log as history information. The mail server (Internet server) 1 outside the company or inside the company The data relay device 3 can be input alone with almost no influence on the setting. The data relay device 3 includes a spam information management database 4, a lexical extraction means 31, a received mail determination means 32, a received mail classification means 33, and a learning means 34.

スパム情報管理データベース4とは、データ中継装置3を中継した電子メールのログ情報と各電子メールのスパム情報を記録したデータベースである。具体的には、ログ情報は各電子メールのメールデータを示したログ識別情報であり(図示せず)、スパム情報は後述の字句抽出手段31でログ識別情報に対応する電子メールからそれぞれ抽出した各字句と、スパム確率度を算出する元となる当該字句が迷惑メールを保存するスパムログ及び非迷惑メールを保存する受信ログに出現する出現度合いの情報であり(図1(B)参照)、これらがスパム情報管理データベース4で管理されている。   The spam information management database 4 is a database in which log information of electronic mail relayed through the data relay device 3 and spam information of each electronic mail are recorded. Specifically, the log information is log identification information indicating mail data of each electronic mail (not shown), and spam information is extracted from the electronic mail corresponding to the log identification information by the lexical extraction means 31 described later. Each lexical word and the lexical word from which the spam probability is calculated are information on the degree of appearance that appears in the spam log storing spam mail and the reception log storing non-spam mail (see FIG. 1B). These are managed by the spam information management database 4.

ログ識別情報は、データ中継装置3を中継した全ての電子メール情報の集合で、少なくとも送受信日時、差出人名、受取人名、電子メールの件名、電子メールの本文、差出人の電子メールアドレス、受取人の電子メールアドレス、電子メールのデータサイズ等の情報である。また、ログ識別情報は企業内部のユーザ毎にエリア分けして履歴情報を管理するのではなく、全ての履歴情報を一元に管理し、全ユーザで共有している。各ユーザの端末機2で削除してしまった電子メールであっても、スパム情報管理データベース4には残っている為、これらの電子メールに対しても後述の各手段の処理を行える。尚、ここでいう「共有」とは、全てのユーザが中継した全ての電子メールを共有する状態に限らず、共有範囲あるいは監視範囲が各ユーザあるいは各部門毎に設定されている状態も含む。後者の場合にも、各ユーザが閲覧可能な範囲において他人の電子メールに対し、後述の各手段を行える。   The log identification information is a set of all e-mail information relayed through the data relay device 3, and includes at least transmission / reception date / time, sender name, recipient name, e-mail subject, e-mail text, sender e-mail address, recipient's e-mail address. Information such as an e-mail address and an e-mail data size. In addition, log identification information is not divided into areas for each user in the company and history information is managed, but all history information is managed in a unified manner and shared by all users. Even if the e-mail has been deleted at the terminal 2 of each user, it remains in the spam information management database 4, so that the processing of each means described later can be performed on these e-mails. Note that “sharing” here is not limited to a state in which all emails relayed by all users are shared, but also includes a state in which a sharing range or a monitoring range is set for each user or each department. Even in the latter case, each means described below can be performed on another person's e-mail within a range that can be browsed by each user.

受信ログの出現度合いは、(a1)「非迷惑メール総数」と(b1)「全非迷惑メール内で、該単語が出現する数」とから算出する値であり、スパムログの出現度合いは、(a2)「迷惑メール総数」と(b2)「全迷惑メール内で、該単語が出現する数」とから算出する値である。そして、単語のスパム確率度は、これら(a1)、(a2)、(b1)、(b2)の値から算出される。   The appearance degree of the reception log is a value calculated from (a1) “total number of non-spam mails” and (b1) “number of occurrences of the word in all non-spam mails”. This is a value calculated from (a2) “total number of spam mails” and (b2) “number of occurrences of the word in all spam mails”. The word spam probability is calculated from these values (a1), (a2), (b1), and (b2).

具体的には、(a1)と(a2)の値は、ログ識別情報から受信ログとスパムログの電子メ
ール件数を集計することで算出され、(b1)と(b2)の値は、〔1〕電子メールを受信しスパム分類するとき、〔2〕電子メールをスパム登録あるいはスパム解除するとき、のタイミングで出現数を加減している。ここで、〔1〕電子メールを受信しスパム分類するとは、電子メールから字句を抽出し、各字句の個数に応じてスパム情報管理データベース4の字句の出現数をカウントアップさせることであり、具体的にはその電子メールがスパムと判別された場合に各字句の(b2)の値がカウントアップされる。また、〔2〕電子メールをスパム登録あるいはスパム解除するとは、ログ識別情報を使って電子メールを読み出し、該電子メールから字句抽出し、上述した〔1〕とほぼ同様に、該電子メールがスパム登録された場合には、各字句につき(b2)の値をカウントアップして、(b1)をカウントダウンすることである。
Specifically, the values of (a1) and (a2) are calculated by aggregating the number of emails in the received log and spam log from the log identification information, and the values of (b1) and (b2) are [1 The number of appearances is adjusted at the timing of receiving an e-mail and classifying spam, and [2] registering or canceling e-mail as spam. Here, [1] receiving e-mail and classifying spam is extracting lexical characters from the e-mail and counting up the number of lexical occurrences in the spam information management database 4 according to the number of each lexical word. Specifically, when the email is identified as spam, the value of (b2) of each lexical word is counted up. [2] To register or cancel an e-mail as spam, the e-mail is read using log identification information, extracted from the e-mail, and lexically extracted from the e-mail. When registered, the value of (b2) is counted up for each lexical phrase, and (b1) is counted down.

尚、ログとは時間の経過とともに変化するものを、後からわかるように残した記録のことであり、具体的にはログ保存先として受信ログ、スパムログ、ウイルスが添付された電子メールを保存するウイルスログ、送信メールを保存する送信ログ、削除の指示が為された各電子メールを退避するゴミ箱がある。   A log is a record that changes over time so that it can be seen later. Specifically, the log storage destination stores emails with received logs, spam logs, and viruses. Virus logs to be sent, send logs to save outgoing mail, and trash to evacuate each email that has been instructed to be deleted.

スパム確率度とは、受信した字句が受信ログに出現することが多いのかスパムログに出現することが多いのかの出現度合いを比較して、字句毎の出現率をトータルし、それらの結果でスパムか非スパムかを表した確率値である。尚、字句のスパム確率も、電子メールのスパム確率も、0〜1の範囲で算出される。電子メールのスパム確率の算出結果が閾値の0.9以上である場合にそのメールはスパムと見なされる。   Spam probability refers to the degree of occurrence of whether each received lexical phrase often appears in the received log or the spam log. It is a probability value indicating whether it is non-spam. The lexical spam probability and the e-mail spam probability are calculated in the range of 0 to 1. When the calculation result of the spam probability of an electronic mail is equal to or higher than a threshold value of 0.9, the mail is regarded as spam.

尚、字句については後述で説明する。   The word / phrase will be described later.

ここでは、スパム情報管理データベース4に電子メールのログ情報とスパム情報を記録して1つのデータベースで管理する場合を説明したが、スパム情報管理データベース4にはスパム情報のみを管理し、ログ情報は後述の受信メール判定手段32により判定結果に該当する電子メールを共有している電子メールの中から取得するようにしてもよい。   Here, the log information and spam information of e-mail are recorded in the spam information management database 4 and managed by one database. However, only the spam information is managed in the spam information management database 4, and the log information is You may make it acquire from the email which is sharing the email corresponding to a determination result by the received mail determination means 32 mentioned later.

字句抽出手段31とは、既に共有している電子メールあるいはデータ中継装置3を中継した受信メールのヘッダ及び本文から出現する各字句を抽出する手段である。字句とは、文字列からある単位で部分を抜き出したものである。具体的には「データ中継装置。」という語句から字句を抽出すると、単語単位の場合には「データ」「中継」「装置」「。」となり、文字単位の場合には「デ」「ー」「タ」「中」「継」「装」「置」「。」となり、一文字単位の場合には「データ中継装置。」となり、隣接2単語の組の場合には「データ中継」「中継装置」「装置。」となり、隣接2文字の組の場合には「デー」「ータ」「タ中」「中継」「継装」「装置」「置。」となる。   The lexical extraction means 31 is a means for extracting each lexical word that appears from the header and the body of the email that has already been shared or the received mail relayed through the data relay device 3. A lexical phrase is a part extracted from a character string in a certain unit. Specifically, when a lexical word is extracted from the phrase “data relay device.”, “Data”, “relay”, “device”, “.” Are obtained in word units, and “de”, “-” in character units. “Ta”, “Medium”, “Join”, “Appearance”, “Place”, “.”, “Data Relay Device” in the case of one character unit, and “Data Relay” “Relay Device” in the case of two adjacent words In the case of a set of two adjacent characters, “data”, “data”, “medium”, “relay”, “joining”, “device”, “device”.

受信メール判定手段32とは、企業内部の端末機2にそれぞれ宛てられた受信メールから字句抽出手段31により抽出した複数の字句と、スパム情報管理データベース4の各字句の出現度合いから算出したスパム確率度とを比較し、受信メールの複数の字句のスパム確率度から受信メールのスパム確率度を算出することにより、受信メールのスパム・非スパムを判定する手段である。具体的には、図1(B)に示すごとく、スパム管理情報データベース5の各字句の出現度合いより各字句のスパム確率度は、
・「完全」のスパム確率度=(36/100)/{(36/100)+2×(3/150)}=0.9
・「登録」のスパム確率度=(15/100)/{(15/100)+2×(20/150)}=0.36
・「無料」のスパム確率度=(32/100)/{(32/100)+2×(8/150)}=0.75
と算出できる。従って、文字列「完全登録無料」のスパム確率度は、
・文字列「完全無料登録」のスパム確率度
=(0.9×0.36×0.75)/{(0.9×0.36×0.75)+(1-0.9)×(1-0.36)×(1-0.75)}
=0.938
と算出される。算出結果0.938は、閾値0.9以上であるため、受信メール判定手段32により「完全登録無料」はスパムと判定される。
The received mail judging means 32 is a spam probability calculated from a plurality of lexical words extracted by the lexical word extracting means 31 from the received mail addressed to the terminal 2 inside the company and the appearance degree of each lexical word in the spam information management database 4. This is a means for determining spam / non-spam of received mail by calculating the spam probability of the received mail from the spam probability of the plurality of words of the received mail. Specifically, as shown in FIG. 1 (B), the spam probability of each lexical word from the degree of appearance of each lexical word in the spam management information database 5 is
-"Complete" spam probability = (36/100) / {(36/100) + 2 x (3/150)} = 0.9
・ "Registration" spam probability = (15/100) / {(15/100) + 2 × (20/150)} = 0.36
・ Free spam probability = (32/100) / {(32/100) + 2 × (8/150)} = 0.75
And can be calculated. Therefore, the spam probability of the string "complete registration free"
・ Spam probability of the string “complete registration”
= (0.9 x 0.36 x 0.75) / {(0.9 x 0.36 x 0.75) + (1-0.9) x (1-0.36) x (1-0.75)}
= 0.938
Is calculated. Since the calculation result 0.938 is equal to or greater than the threshold value 0.9, the received mail determination means 32 determines that “complete registration free” is spam.

受信メール分類手段33とは、受信メール判定手段32の判定結果に基づいてスパムログあるいは受信ログへ受信メールを分類する手段である。スパムと判定された迷惑メールを削除せずにスパムログへ保存することにより、スパムの傾向を判断することに利用することができる。   The received mail classification means 33 is a means for classifying received mail into a spam log or a received log based on the determination result of the received mail determination means 32. By storing the spam mail determined to be spam in the spam log without deleting it, it can be used to determine the tendency of spam.

学習手段34とは、各受信者の意に反した受信メール判定手段32の判定結果により受信メール分類手段33でスパムログあるいは受信ログへ分類された受信メールに対し、企業内部の端末機2から各受信者の判断によりスパム・非スパムの指示が直接為され、受信メール判定手段のスパム・非スパムの判定精度を高める手段である。具体的には、スパム登録手段34aおよびスパム登録解除手段34bとを有する。   The learning means 34 refers to the received mail classified into the spam log or the received log by the received mail classification means 33 based on the determination result of the received mail determination means 32 against the intention of each recipient from the terminal 2 inside the company. Spam / non-spam instructions are directly given by each recipient's judgment, and this is means for improving the accuracy of determination of spam / non-spam by the received mail judgment means. Specifically, it has spam registration means 34a and spam registration cancellation means 34b.

スパム登録手段34aは、受信メール判定手段32の非迷惑メールとの判定結果により受信ログに分類されるが、各受信者により迷惑メールと判断された受信メールに対し、各受信者の指示により受信ログの一覧あるいは受信メールの本文の画面に設けられたスパム登録ボタンが1クリックされると、スパム情報管理データベース4へログ識別情報、抽出された各字句及び出現度合いを登録すると共に、受信メールを受信ログからスパムログへ移動する手段である。一方、スパム登録解除手段34bは、受信メール判定手段32の迷惑メールとの判定結果によりスパムログに分類されるが、各受信者により非迷惑メールと判断された受信メールに対し、各受信者の指示によりスパムログの一覧あるいは受信メールの本文の画面に設けたスパム除外ボタンが1クリックされると、スパム情報管理データベース4に登録されたログ識別情報、抽出された各字句及び出現度合いを除外すると共に、受信メールをスパムログから受信ログへ移動する手段である。尚、スパム登録手段34a及びスパム登録解除手段34bの詳細については図2及び図3を用いて説明する。   The spam registration unit 34a is classified as a reception log based on the determination result of the received mail determination unit 32 as non-spam mail. However, the received mail determined to be spam by each recipient is received according to the instruction of each recipient. When the spam registration button provided in the log list or the received mail text screen is clicked once, the log identification information, each extracted lexical word and the degree of appearance are registered in the spam information management database 4, and the received mail It is a means to move from the reception log to the spam log. On the other hand, the spam registration canceling unit 34b is classified into a spam log according to the determination result of the received mail determining unit 32 as spam mail, but for each received mail determined as non-spam mail by each receiver, When a spam exclusion button provided on the spam log list or the body text screen of the received mail is clicked by one instruction, the log identification information registered in the spam information management database 4, each extracted lexical word, and the degree of appearance are excluded. A means for moving received mail from the spam log to the received log. The details of the spam registration unit 34a and the spam registration cancellation unit 34b will be described with reference to FIGS.

上述の各手段の機能やデータベース等の資源を一つのデータ中継装置にまとめることにより、設置する前の現行の設定等を変更せずに容易に設置できる。そして、データ中継装置以下に接続された企業内部の全てのユーザでデータ中継装置のデータベース等の資源を共有することにより、特別なシステムの知識を有し、データベースへの登録・解除の権限を持つメール管理者を設けなくても、企業のユーザがスパム・非スパムの情報をデータベースに反映してスパム確率度の精度の向上させ、誤判定を大幅に減少することができるようになる。   By combining the functions of the above-described means and resources such as a database into one data relay device, it can be easily installed without changing the current settings before installation. And, by sharing resources such as the database of the data relay device among all users inside the company connected to the data relay device and below, it has knowledge of the special system and has the authority to register / release in the database Even without a mail administrator, corporate users can reflect spam / non-spam information in the database, improve the accuracy of spam probability, and greatly reduce false positives.

次に、図2を用いて本発明のスパム登録手段34aによる操作を説明する。図2(A)は受信メールの一覧表示画面の一例であり、図2(B)は受信メールの本文を示す画面の一例である。   Next, the operation by the spam registration unit 34a of the present invention will be described with reference to FIG. 2A is an example of a received mail list display screen, and FIG. 2B is an example of a screen showing the text of the received mail.

図2(A)に示す如く、受信メール一覧表示画面10aは、ログ選択エリア11と、受信メール一覧表エリア12と、操作指示エリア13とから構成される。   As shown in FIG. 2 (A), the received mail list display screen 10a includes a log selection area 11, a received mail list area 12, and an operation instruction area 13.

ログ選択エリア11には、電子メールの記録先であるログの一覧が表示されている。具体的には、前述の受信ログ、送信ログ、スパムログ、ウイルスログ、ゴミ箱が順に表示されている。   In the log selection area 11, a list of logs that are recording destinations of e-mails is displayed. Specifically, the above reception log, transmission log, spam log, virus log, and trash can are displayed in this order.

受信メール一覧表エリア12には、一覧から所望の受信メールを選択するメール選択ボックス12aと、企業内部の部門等のグループを選択するグループ選択欄12bと、該グループ間で共有している受信メールの受信日時や差出人等といった情報を表示するメール情報表示欄12cと、受信メールの情報に含まれる字句で検索をするメール検索欄12dとがある。具体的には、総務部で共有する受信メールの一覧を表示させる場合は、グループ選択欄12bより「総務」を選択すると該当する受信メールのみが抽出されてメール情報表示欄12cに表示される。そして、メール情報表示欄12cの標題をクリックすると(この場合は、2006/8/30 00:03に田×さんから送信された電子メールとする。)、図2(B)に示す受信メールの本文の画面10bが表示される。尚、図示はしないが、メール検索欄12dに「報告書」と字句を入力して検索ボタンを押下すれば、「報告書」の字句を含む受信メールが抽出されて受信メール一覧表エリア12に表示される。更に詳細検索ボタンで詳細条件を設定すれば、受信メールは絞り込まれて抽出される。   The received mail list area 12 includes a mail selection box 12a for selecting a desired received mail from the list, a group selection column 12b for selecting a group such as a department within the company, and a received mail shared between the groups. There are a mail information display column 12c for displaying information such as the date and time of receipt, sender, and the like, and a mail search column 12d for searching with words included in the received mail information. Specifically, when displaying a list of received mails shared by the general affairs department, if “general affairs” is selected from the group selection field 12b, only the corresponding received mails are extracted and displayed in the mail information display field 12c. Then, when the title of the mail information display column 12c is clicked (in this case, it is an e-mail sent from Mr. Ta on 2006/8/30 00:03), the received mail shown in FIG. A body screen 10b is displayed. Although not shown in the figure, if “report” is entered in the mail search field 12d and the search button is pressed, the received mail including the “report” word is extracted and received in the received mail list area 12. Is displayed. Furthermore, if detailed conditions are set with a detailed search button, received mails are narrowed down and extracted.

操作指示エリア13には、メール選択ボックス12aにチェックを付与した受信メールに対し、操作を指示するボタンが配置されている。具体的には、メールのソースをファイルとしてダウンロードするための出力するボタン13a、ゴミ箱へ移動するボタン13b、受信者へ再配信するボタン13c、スパム登録をするボタン13dが配置されている。   In the operation instruction area 13, a button for instructing an operation for a received mail whose mail selection box 12a is checked is arranged. Specifically, an output button 13a for downloading a mail source as a file, a button 13b for moving to a trash box, a button 13c for redistributing to a recipient, and a button 13d for registering spam are arranged.

図示したように、受信者(この場合は○山××さん)は受信メール一覧表に表示された自分宛ての受信メールを読んでいて迷惑メールを発見した場合には、該当する受信メールのメール選択ボックス12aにチェックを付与し(この場合は2件)、スパム登録をするボタン13dを押下する。受信者の指示によりスパム登録手段34aの処理が起動され、チェックを付与した2件の受信メールはスパムログへ移動されると共に、スパム情報管理データベース4へ登録するスパム確率の情報を生成する処理が起動される。具体的には、字句抽出手段31により受信メールから抽出した各字句と、受信メール判定手段32により算出された各字句の出現度合いと、スパム登録手段34aによる移動先のログ識別情報とがスパム情報管理データベース4に登録される。尚、メール受信者以外のユーザであっても、共有している受信メールであれば、メール受信者に代わって同様にスパム登録をすることができる。   As shown in the figure, if the recipient (in this case, Mr. Yama xx) reads the received mail addressed to himself / herself displayed in the received mail list and finds junk mail, the mail of the corresponding received mail A check is given to the selection box 12a (in this case, two cases), and the button 13d for spam registration is pressed. The process of the spam registration means 34a is started by the instruction of the recipient, and the two received mails with the check added are moved to the spam log, and the process of generating the spam probability information to be registered in the spam information management database 4 is performed. It is activated. Specifically, each lexical word extracted from the received mail by the lexical extracting means 31, the degree of appearance of each lexical word calculated by the received mail determining means 32, and the log identification information of the movement destination by the spam registration means 34a are spam information. Registered in the management database 4. Note that even users other than mail recipients can similarly register spam on behalf of mail recipients as long as they are shared received emails.

また、上述のように、受信メール一覧表エリア12で複数の受信メールを選択して一度にスパム登録等の処理をする代わりに、図2(B)に示すごとく、受信メールの本文の画面10bより1件ずつスパム登録等の処理をしても良い。この場合には、画面の下部の操作指示エリア13’に配置された各ボタンを用いて操作指示を行えば良い。尚、ソースを表示するボタン13’eは受信メールのソースを表示させるボタンであり、他のボタンについては操作指示エリア13と同様なので省略する。   Further, as described above, instead of selecting a plurality of received mails in the received mail list area 12 and performing a process such as spam registration at a time, as shown in FIG. You may process spam registration etc. one by one. In this case, an operation instruction may be performed using each button arranged in the operation instruction area 13 'at the bottom of the screen. The source display button 13'e is a button for displaying the source of the received mail, and the other buttons are the same as those in the operation instruction area 13 and are omitted.

更に、図2(A)及び図2(B)に示した画面レイアウトはこの形態に限らず、各欄を有していればレイアウトは異なってもよい。   Further, the screen layouts shown in FIGS. 2A and 2B are not limited to this form, and the layout may be different as long as each column is provided.

次に、図3を用いて本発明のスパム登録解除手段34bによる操作を説明する。図3(A)は迷惑メールの一覧表示画面の一例であり、図3(B)は迷惑メールの本文を示す画面の一例である。   Next, the operation by the spam registration cancellation means 34b of the present invention will be described with reference to FIG. FIG. 3A is an example of a list display screen of spam mail, and FIG. 3B is an example of a screen showing the text of spam mail.

図3(A)に示す如く、迷惑メール一覧表示画面20aは、ログ選択エリア21と、迷惑メール一覧表エリア22と、操作指示エリア23とから構成される。   As shown in FIG. 3A, the junk mail list display screen 20 a includes a log selection area 21, a junk mail list area 22, and an operation instruction area 23.

ログ選択エリア21には、上述の受信メール一覧表示画面10aと同様に、電子メールの記録先である受信ログ、送信ログ、スパムログ、ウイルスログ、ゴミ箱が順に表示されている。   Similarly to the received mail list display screen 10a described above, the log selection area 21 displays the reception log, the transmission log, the spam log, the virus log, and the trash that are the recording destinations of the e-mail.

迷惑メール一覧表エリア22には、一覧から所望の迷惑メールを選択するメール選択ボックス22aと、企業内部の部門等のグループを選択するグループ選択欄22bと、該グループ間で共有している迷惑メールの情報を表示するメール情報表示欄22cと、迷惑メールの情報に含まれる字句で検索をするメール検索欄22dとがある。具体的には、共有する全迷惑メールの一覧を表示させる場合は、グループ選択欄22bより「すべて表示」を選択すればよい。そして、メール情報表示欄22cの標題をクリックすると(この場合は、2006/8/29 13:34に×村○○さんから送信された電子メールとする。)、図3(B)に示す迷惑メールの本文の画面20bが表示される。尚、図示はしないが、メール検索欄22dに「こんにちは」と字句を入力して検索ボタンを押下すれば、「こんにちは」の字句を含む迷惑メールが抽出されて迷惑メール一覧表エリア22に表示される。更に詳細検索ボタンで詳細条件を設定すれば、迷惑メールは絞り込まれて抽出される。   The spam mail list area 22 includes a mail selection box 22a for selecting a desired spam mail from the list, a group selection field 22b for selecting a group such as a department within the company, and a spam mail shared between the groups. There is a mail information display field 22c for displaying the information of the mail, and a mail search field 22d for searching with words and phrases included in the spam mail information. Specifically, in order to display a list of all spam mails to be shared, “display all” may be selected from the group selection field 22b. Then, when the title of the mail information display field 22c is clicked (in this case, it is an email sent from Mr. X village XX on 2006/8/29 13:34), the inconvenience shown in FIG. A mail text screen 20b is displayed. It should be noted that, although not shown, if the e-mail search field 22d to "Hello" and press the search button and enter the lexical, appear in the Junk E-mail list area 22 is junk e-mail extraction, including the lexical of "Hello" The Furthermore, if detailed conditions are set with a detailed search button, spam mails are narrowed down and extracted.

操作指示エリア23には、メール選択ボックス22aにチェックを付与した迷惑メールに対し、操作を指示するボタンが配置されている。具体的には、メールのソースをファイルとしてダウンロードするための出力ボタン23a、スパムから除外するボタン23fが配置されている。   In the operation instruction area 23, a button for instructing an operation for a junk mail with a check in the mail selection box 22a is arranged. Specifically, an output button 23a for downloading a mail source as a file and a button 23f for excluding it from spam are arranged.

図示したように、受信者(この場合は○山××さん)は迷惑メール一覧表に自分宛ての非迷惑メールを発見した場合には、該当する非迷惑メールのメール選択ボックス22aにチェックを付与し(この場合は1件)、スパムから除外するボタン23fを押下する。受信者の指示によりスパム登録解除手段34bの処理が起動され、チェックを付与した1件の非迷惑メールは受信ログへ移動されると共に、スパム情報として登録されていた当該非迷惑メールのログ識別情報と各字句と該各字句の出現度合いとがスパム情報管理データベース4から除外される。尚、メール受信者以外のユーザであっても、共有している迷惑メールであれば、メール受信者に代わって同様に非迷惑メールをスパムから解除することができる。   As shown in the figure, if a recipient (in this case, Mr. Yama XX) finds a non-spam mail addressed to himself / herself in the spam mail list, he / she adds a check to the mail selection box 22a for the corresponding non-spam mail. (In this case, one case) and the button 23f to exclude from spam is pressed. The processing of the spam registration cancellation unit 34b is activated in accordance with the instruction of the recipient, and one non-spam mail with a check is moved to the reception log and log identification information of the non-spam mail registered as spam information , Each lexical phrase and the appearance degree of each lexical phrase are excluded from the spam information management database 4. Even users other than mail recipients can remove non-spam mail from spam in the same manner on behalf of the mail recipients if they are shared spam mails.

また、上述のように、迷惑メール一覧表エリア22で複数の受信メールを選択して一度にスパム登録解除等の処理をする代わりに、図3(B)に示すごとく、迷惑メールの本文の画面より1件ずつスパム登録解除等の処理をしても良い。この場合には、画面の下部の操作指示エリア23’に配置された各ボタンを用いて操作指示を行えば良い。尚、各ボタンは前述のものと同様なので説明は省略する。   Further, as described above, instead of selecting a plurality of received mails in the spam mail list area 22 and performing processing such as canceling spam registration at a time, as shown in FIG. You may perform processing such as spam registration cancellation one by one. In this case, an operation instruction may be performed using each button arranged in the operation instruction area 23 'at the bottom of the screen. Since each button is the same as described above, description thereof is omitted.

更に、図3(A)及び図3(B)に示した画面レイアウトはこの形態に限らず、各欄を有していればレイアウトは異なってもよい。   Further, the screen layouts shown in FIGS. 3A and 3B are not limited to this form, and the layout may be different as long as each column is provided.

図2及び図3で上述したように、データ中継装置で中継した全ての電子メールは、各受信者以外のユーザであっても当該受信者に代わって読むことができるので、受信ログ中の迷惑メールやスパムログ中の非迷惑メールを発見した場合は、各受信者あるいは当該受信者以外のユーザによりスパム登録及びスパム解除のボタンが押下されてスパム登録手段及びスパム登録解除手段の処理が起動される。そして、企業内部の全てのユーザがスパム・非スパムを管理できるので、メール管理者を不要とした迷惑メールの排除システムが実現できる。   As described above with reference to FIGS. 2 and 3, all e-mails relayed by the data relay device can be read on behalf of the recipients even by users other than the recipients. When a non-spam mail is found in an email or spam log, the spam registration means and the spam registration release means are activated by pressing the spam registration and spam release buttons by each recipient or a user other than the recipient. The And since all users inside the company can manage spam / non-spam, it is possible to realize a spam mail elimination system that eliminates the need for a mail manager.

最後に、図4は本発明の迷惑メール除外システムの各手段による処理を説明するフロー図である。   Finally, FIG. 4 is a flowchart for explaining processing by each means of the spam mail exclusion system of the present invention.

まず、企業内部の端末機に宛てられた受信メールがデータ中継装置3を中継する(ステップS1)。続いて、字句抽出手段31により受信メール中の各字句が抽出される(ステップS2)。受信メール判定手段32により、字句抽出手段31で抽出された受信メール中の複数の字句と、スパム情報管理データベース4で管理する共有している各電子メールの各字句の出現度合いから算出したスパム確率度とを比較して、該受信メールのスパム確率度を算出し、該受信メールのスパム・非スパムの判定を行う(ステップS3)。   First, a received mail addressed to a company internal terminal relays the data relay apparatus 3 (step S1). Subsequently, each word / phrase in the received mail is extracted by the word / phrase extracting means 31 (step S2). Spam probability calculated by the received mail determination means 32 from the appearance of a plurality of lexical characters in the received mail extracted by the lexical extraction means 31 and each lexical word of each shared email managed by the spam information management database 4 The degree of spam probability of the received mail is calculated by comparing the degree of the received mail and spam / non-spam of the received mail is determined (step S3).

そして、受信メール分類手段33により、判定結果がスパムであればスパムログへ受信メールを分類して保存し、判定結果が非スパムであれば受信ログへ受信メールを分類して保存する(ステップS4)。   Then, the received mail classification means 33 classifies and stores the received mail in the spam log if the determination result is spam, and classifies and stores the received mail in the reception log if the determination result is non-spam (step S4). ).

そして、企業内部の各受信者は受信ログ及びスパムログの受信メールを読み、正しく振り分けられたか否かを確認する(ステップS5)。正しく振り分けられた場合は(ステップS5のYes)、各受信者の判断と受信メール判定手段32の判定結果が一致する場合であるので、受信メールを正しいログへ移動する処理等は行われずに終了する。   Then, each recipient in the company reads the received mail in the reception log and the spam log, and confirms whether or not the mail has been correctly distributed (step S5). If correctly sorted (Yes in step S5), the judgment of each recipient matches the judgment result of the received mail judgment means 32, so the process ends without moving the received mail to the correct log. To do.

一方、正しく振り分けられない場合は(ステップS5のNo)、受信メール判定手段32により各受信者の意に反した判定結果がなされたことになるので、各受信者により以下の指示が為される(ステップS6)。   On the other hand, if it is not correctly distributed (No in step S5), the received mail determination means 32 has made a determination result contrary to the intention of each receiver, so the following instructions are given by each receiver. (Step S6).

〔SW=スパムから除外ボタンが押下された場合〕
スパムログに非スパムと判定されるべき受信メールが振り分けられているので、各受信者は迷惑メール一覧画面20aのメール選択ボックス22aにチェックを付与した後にスパムから解除するボタン23fを押下するか、迷惑メールの本文の画面20bより直接スパムから解除するボタン23’fを押下する。これによりスパム登録解除手段34bは起動され、スパム情報管理データベース4に登録済みの当該受信メールのログ識別情報、各字句、該各字句の出現度合いは除外されると同時に、当該受信メールは受信ログへ移動される(ステップS7)。
[When SW = Exclude button from spam is pressed]
Since the received mail that should be determined as non-spam is sorted in the spam log, each recipient presses the button 23f for canceling spam after giving a check to the mail selection box 22a of the junk mail list screen 20a, A button 23'f for directly canceling spam from the spam mail text screen 20b is pressed. As a result, the spam registration cancellation unit 34b is activated, and the log identification information of each received mail registered in the spam information management database 4, each lexical word, and the appearance degree of each lexical word are excluded, and at the same time, the received mail is (Step S7).

〔SW=スパム登録ボタンが押下された場合〕
受信ログにスパムと判定されるべき迷惑メールが振り分けられた場合のため、各受信者は受信メール一覧画面10aのメール選択ボックス12aにチェックを付与した後にスパムへ登録するボタン13dを押下するか、受信メールの本文の画面10bより直接スパムへ登録するボタン13’dを押下する。これによりスパム登録手段34aは起動され、スパム情報管理データベース4に当該迷惑メールのログ識別情報、各字句、該各字句の出現度合いを新たに登録すると同時に、当該迷惑メールはスパムログへ移動される(ステップS8)。
[When SW = spam registration button is pressed]
In the case where spam mail to be determined as spam is distributed to the reception log, each recipient presses the button 13d for registering as spam after checking the mail selection box 12a on the received mail list screen 10a, A button 13'd for directly registering as spam is pressed from the body screen 10b of the received mail. As a result, the spam registration unit 34a is activated, and the spam identification management database 4 newly registers the log identification information of each junk mail, each lexical word, and the appearance degree of each lexical word, and at the same time, the junk mail is moved to the spam log. (Step S8).

そして、ステップS7あるいはステップS8によりスパム情報管理データベース4が学習され全ての処理は終了する。   And the spam information management database 4 is learned by step S7 or step S8, and all the processes are completed.

本発明の迷惑メール除外システムを説明する(A)構成図、(B)スパム情報管理データベースの構成図である。It is the (A) block diagram explaining the spam mail exclusion system of this invention, (B) The block diagram of a spam information management database. 本発明の(A)受信メール一覧表示画面、(B)受信メール本文の画面の一例である。It is an example of the screen of (A) received mail list display screen and (B) received mail text of the present invention. 本発明の(A)迷惑メール一覧表示画面、(B)迷惑メール本文の画面の一例である。It is an example of the screen of (A) Junk mail list display screen of this invention, (B) Junk mail text. 本発明の迷惑メール除外システムの処理を示すフロー図である。It is a flowchart which shows the process of the spam mail exclusion system of this invention.

符号の説明Explanation of symbols

1 インターネットサーバ
2 企業内部の端末機
3 データ中継装置
31 字句抽出手段
32 受信メール判定手段
33 受信メール分類手段
34 学習手段
34a スパム登録手段
34b スパム登録解除手段
4 スパム情報管理データベース
DESCRIPTION OF SYMBOLS 1 Internet server 2 Terminal in company 3 Data relay apparatus 31 Lexical extraction means 32 Received mail determination means 33 Received mail classification means 34 Learning means 34a Spam registration means 34b Spam registration cancellation means 4 Spam information management database

Claims (3)

インターネットサーバと企業内部の端末機との間にデータ中継装置を設置し、前記データ中継装置を中継した全ての電子メールの情報をログに記録して前記企業内部の端末機で共有し、中継した前記電子メールのうち迷惑メールの受信を排除する迷惑メール排除システムにおいて、
既に共有している前記電子メールあるいは前記データ中継装置を中継した受信メールのヘッダ及び本文から出現する各字句を抽出する字句抽出手段と、
共有している前記電子メールのログを示したログ識別情報と、前記字句抽出手段により前記ログ識別情報に対応する前記電子メールから抽出された各字句と、前記抽出された各字句が迷惑メールを保存するスパムログ及び非迷惑メールを保存する受信ログに出現する出現度合いとを管理するスパム情報管理データベースと、
前記企業内部の端末機にそれぞれ宛てられた前記受信メールから前記字句抽出手段により抽出した複数の字句と、前記スパム情報管理データベースの前記出現度合いから算出した各字句のスパム確率度とを比較して、前記受信メールのスパム確率度を算出することにより、前記受信メールのスパム・非スパムを判定する受信メール判定手段と、
判定結果に基づいて前記スパムログあるいは前記受信ログへ前記受信メールを分類する受信メール分類手段と、
各受信者の意に反した前記判定結果により前記スパムログあるいは前記受信ログへ分類された前記受信メールに対し、前記企業内部の端末機から前記各受信者の判断によりスパム・非スパムの指示が直接為され、前記受信メール判定手段のスパム・非スパムの判定精度を高める学習手段とで構成されることを特徴とする迷惑メール排除システム。
A data relay device was installed between the Internet server and the company terminal, and all the email information relayed by the data relay device was recorded in a log and shared by the company terminal. In the junk e-mail rejection system that eliminates the reception of junk e-mail among the e-mails,
Lexical extraction means for extracting each lexical word appearing from the header and body of the received mail relayed through the electronic mail or the data relay device already shared;
Log identification information indicating the log of the shared email, each lexical word extracted from the electronic mail corresponding to the log identification information by the lexical extraction means, and each extracted lexical word A spam information management database for managing the spam log to be stored and the appearance degree appearing in the reception log for storing non-spam mail;
Comparing a plurality of lexical words extracted by the lexical extraction means from the received mail addressed to each terminal in the company and a spam probability degree of each lexical word calculated from the appearance degree of the spam information management database , Received mail determination means for determining spam / non-spam of the received mail by calculating a spam probability of the received mail;
Received mail classification means for classifying the received mail into the spam log or the received log based on a determination result;
For the received mail classified into the spam log or the received log according to the determination result against each recipient's will, an instruction of spam / non-spam is given from the terminal in the company according to the judgment of each recipient. An unsolicited mail elimination system, characterized in that the system is composed directly with learning means for improving the accuracy of spam / non-spam judgment of the received mail judgment means.
前記学習手段は、前記受信メール判定手段の非迷惑メールとの判定結果により前記受信ログに分類されるが、前記各受信者により迷惑メールと判断された前記受信メールに対し、前記各受信者の指示により前記受信ログの一覧あるいは前記受信メールの本文の画面に設けたスパム登録ボタンが1クリックされると、前記スパム情報管理データベースへ前記ログ識別情報、前記抽出された各字句及び前記出現度合いを登録すると共に、前記受信メールを前記受信ログから前記スパムログへ移動するスパム登録手段を備えることを特徴とする請求項1に記載の迷惑メール排除システム。   The learning means is classified into the reception log according to the determination result of the received mail determination means as non-spam mail, but for each received mail determined to be spam mail by each receiver, When a spam registration button provided on the received log list or the received mail text screen is clicked once by an instruction, the log identification information, each extracted word and phrase, and the degree of appearance are displayed in the spam information management database. The spam mail eliminating system according to claim 1, further comprising a spam registration unit that registers and moves the received mail from the reception log to the spam log. 前記学習手段は、前記受信メール判定手段の迷惑メールとの判定結果により前記スパムログに分類されるが、前記各受信者により非迷惑メールと判断された前記受信メールに対し、前記各受信者の指示により前記スパムログの一覧あるいは前記受信メールの本文の画面に設けたスパム除外ボタンが1クリックされると、前記スパム情報管理データベースに登録された前記ログ識別情報、前記抽出された各字句及び前記出現度合いを除外すると共に、前記受信メールを前記スパムログから前記受信ログへ移動するスパム登録解除手段を備えることを特徴とする請求項1に記載の迷惑メール排除システム。   The learning means is classified into the spam log according to the determination result of spam received by the received mail determination means, but for each received mail determined as non-spam mail by each receiver, When a spam exclusion button provided on the spam log list or the body text screen of the received mail is clicked by one instruction, the log identification information registered in the spam information management database, the extracted words and phrases, The spam mail rejection system according to claim 1, further comprising: a spam registration cancellation unit that excludes the appearance degree and moves the received mail from the spam log to the reception log.
JP2007199879A 2007-07-31 2007-07-31 Unwanted e-mail exclusion system Pending JP2009037346A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2007199879A JP2009037346A (en) 2007-07-31 2007-07-31 Unwanted e-mail exclusion system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2007199879A JP2009037346A (en) 2007-07-31 2007-07-31 Unwanted e-mail exclusion system

Publications (1)

Publication Number Publication Date
JP2009037346A true JP2009037346A (en) 2009-02-19

Family

ID=40439203

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007199879A Pending JP2009037346A (en) 2007-07-31 2007-07-31 Unwanted e-mail exclusion system

Country Status (1)

Country Link
JP (1) JP2009037346A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013529345A (en) * 2010-05-21 2013-07-18 バウルティブ リミテッド System and method for securely using a messaging system
JP2017151776A (en) * 2016-02-25 2017-08-31 日本電信電話株式会社 Information management apparatus, information management method, and information management program
JP2018018542A (en) * 2017-10-23 2018-02-01 Nttテクノクロス株式会社 Fraud mail determination device and program
JP2019139565A (en) * 2018-02-13 2019-08-22 日本電気株式会社 Management device, management method, and program therefor
JP2020113332A (en) * 2015-06-18 2020-07-27 Line株式会社 Server, program, and information processing method

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006048545A (en) * 2004-08-06 2006-02-16 Nippon Telegr & Teleph Corp <Ntt> Mail filtering system and method, program, and recording medium
JP2007122148A (en) * 2005-10-25 2007-05-17 Just Syst Corp E-mail classification device and e-mail classification method

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006048545A (en) * 2004-08-06 2006-02-16 Nippon Telegr & Teleph Corp <Ntt> Mail filtering system and method, program, and recording medium
JP2007122148A (en) * 2005-10-25 2007-05-17 Just Syst Corp E-mail classification device and e-mail classification method

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CSNG200600970013; 漣 一平: '宛先不明メールを利用した分散協調型spamフィルタの認識率向上' 情報処理学会研究報告 Vol.2005 No.39 第2005巻, 20050513, p.79〜84, 社団法人情報処理学会 *
JPN6012029230; 漣 一平: '宛先不明メールを利用した分散協調型spamフィルタの認識率向上' 情報処理学会研究報告 Vol.2005 No.39 第2005巻, 20050513, p.79〜84, 社団法人情報処理学会 *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013529345A (en) * 2010-05-21 2013-07-18 バウルティブ リミテッド System and method for securely using a messaging system
US9721119B2 (en) 2010-05-21 2017-08-01 Vaultive Ltd. System and method for secure use of messaging systems
JP2020113332A (en) * 2015-06-18 2020-07-27 Line株式会社 Server, program, and information processing method
JP2017151776A (en) * 2016-02-25 2017-08-31 日本電信電話株式会社 Information management apparatus, information management method, and information management program
JP2018018542A (en) * 2017-10-23 2018-02-01 Nttテクノクロス株式会社 Fraud mail determination device and program
JP2019139565A (en) * 2018-02-13 2019-08-22 日本電気株式会社 Management device, management method, and program therefor
JP7006347B2 (en) 2018-02-13 2022-01-24 日本電気株式会社 Management device, management method and its program

Similar Documents

Publication Publication Date Title
CN112567407B (en) Privacy-preserving tagging and classification of emails
US7433923B2 (en) Authorized email control system
EP2446411B1 (en) Real-time spam look-up system
US8069128B2 (en) Real-time ad-hoc spam filtering of email
US8135779B2 (en) Method, system, apparatus, and software product for filtering out spam more efficiently
US20100161734A1 (en) Determining spam based on primary and secondary email addresses of a user
US20060168006A1 (en) System and method for the classification of electronic communication
US20060265498A1 (en) Detection and prevention of spam
JP2005208780A (en) Mail filtering system and url black list dynamic construction method to be used for the same
US11539726B2 (en) System and method for generating heuristic rules for identifying spam emails based on fields in headers of emails
JP2009037346A (en) Unwanted e-mail exclusion system
US20100161748A1 (en) Apparatus, a Method, a Program and a System for Processing an E-Mail
US9055018B2 (en) Related message detection and indication
CN1806237A (en) System and method for knock notification to an unsolicited message
JP2002354044A (en) Method and apparatus for recognizing unwanted e-mail and e-mail server
US20050283519A1 (en) Methods and systems for combating spam
JP4963099B2 (en) E-mail filtering device, e-mail filtering method and program
CN101951563B (en) Technique for fault avoidance in mail gateway
JP3949978B2 (en) E-mail reception rejection device
JP5051664B2 (en) E-mail mistransmission prevention apparatus and e-mail mistransmission prevention method
JP4821863B2 (en) E-mail transfer control method and transfer control apparatus
JP2002056001A (en) Savvy person extraction device and computer readable recording medium recording savvy person extraction program
JP2003188921A (en) Email transfer device
CN119697149A (en) Mail relay method and system based on Postfix
JP2006287380A (en) Method of detecting e-mail virus and mail server

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20100720

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120531

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120612

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20121106