JP2013131048A - Information processing apparatus, information processing method and program - Google Patents
Information processing apparatus, information processing method and program Download PDFInfo
- Publication number
- JP2013131048A JP2013131048A JP2011280264A JP2011280264A JP2013131048A JP 2013131048 A JP2013131048 A JP 2013131048A JP 2011280264 A JP2011280264 A JP 2011280264A JP 2011280264 A JP2011280264 A JP 2011280264A JP 2013131048 A JP2013131048 A JP 2013131048A
- Authority
- JP
- Japan
- Prior art keywords
- unread
- information processing
- processing apparatus
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims description 54
- 238000003672 processing method Methods 0.000 title claims description 6
- 238000000034 method Methods 0.000 claims abstract description 52
- 238000001914 filtration Methods 0.000 claims abstract description 19
- 239000000463 material Substances 0.000 claims abstract description 8
- 238000012545 processing Methods 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 14
- 239000000284 extract Substances 0.000 claims description 4
- 238000000605 extraction Methods 0.000 claims 3
- 230000006399 behavior Effects 0.000 abstract description 4
- 230000005540 biological transmission Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 3
- KNMAVSAGTYIFJF-UHFFFAOYSA-N 1-[2-[(2-hydroxy-3-phenoxypropyl)amino]ethylamino]-3-phenoxypropan-2-ol;dihydrochloride Chemical compound Cl.Cl.C=1C=CC=CC=1OCC(O)CNCCNCC(O)COC1=CC=CC=C1 KNMAVSAGTYIFJF-UHFFFAOYSA-N 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 239000004973 liquid crystal related substance Substances 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 229910052710 silicon Inorganic materials 0.000 description 1
- 239000010703 silicon Substances 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
Abstract
Description
本発明は、迷惑メールか否かの判定技術に関する。 The present invention relates to a technique for determining whether or not a junk mail.
近年、情報の伝達を行う手段として電子メールが広く利用されている。電子メールは商品の宣伝・広告としても利用されるなど、発信者から定期的に一方的に情報を発信する際にも用いられている。 In recent years, electronic mail has been widely used as a means for transmitting information. E-mails are also used for sending information unilaterally from senders, such as for use in advertising and advertising of products.
このような宣伝広告などについては、受信者にとって必ずしも必要な情報であるとは限らない。そのため、メール自体は受信したものの未読のまま放置される電子メールも少なくない。 Such advertisements are not necessarily necessary information for the receiver. For this reason, many e-mails are received that have been received but are left unread.
未読のまま放置される電子メールについては、迷惑メールとしてその都度削除したり、または必要な電子メールとは別管理をすることが行われている。 E-mails that are left unread are deleted as spam mails each time, or are managed separately from necessary e-mails.
このような迷惑メールか否かの判断にあたり、従来からベイズ推論を用いた迷惑メールフィルタリングが行われている。 Conventionally, junk mail filtering using Bayesian inference has been performed to determine whether or not it is such junk mail.
また、特許文献1には、未読メール件数が所定値を超えた場合は、当該メールの送信元からのメール受信を拒否するという技術が記載されている。 Japanese Patent Application Laid-Open No. 2004-228561 describes a technique of rejecting mail reception from the mail transmission source when the number of unread mails exceeds a predetermined value.
しかし、特許文献1には「未読件数」を基準に判断しているもので、受信者にとって必要な電子メールであっても、一定件数以上が未読のままであると、当該電子メールの送信元からの電子メールを受信できなくなり、不都合が生じてしまう。 However, Patent Document 1 makes a determination based on “the number of unread messages”. Even if an e-mail message is necessary for the recipient, if a predetermined number or more remains unread, the sender of the e-mail message Will not be able to receive e-mails from and will cause inconvenience.
また、ベイズ推論型迷惑メールフィルタは、学習DBを生成するために利用者が手動で迷惑として判断したメールを学習DBへ登録するか、迷惑メールに多く含まれていると言われている単語や送信元などの辞書情報をもとにメールを判定し、これを学習DBに保存するものが多い。 In addition, the Bayesian inference type spam filter registers the email that the user has manually judged as annoying to generate the learning DB in the learning DB, or a word that is said to be included in many spam emails. In many cases, mail is determined based on dictionary information such as a transmission source and stored in a learning DB.
辞書情報をもとに判定する場合は、一般的な迷惑メールの学習パターンとして登録できるが、利用者が迷惑メールと判断することとは異なり、利用者自身に依存した学習パターンまでは登録できない。そのため、利用者個人に依存する学習パターンを登録するためには、当該利用者が手動で登録するしかない。 When judging based on dictionary information, it can be registered as a general spam mail learning pattern, but unlike a user's judgment of spam mail, a learning pattern depending on the user cannot be registered. Therefore, in order to register the learning pattern depending on the individual user, the user has to register it manually.
しかし、利用者が手動で判断し学習DBへ登録するのは、迷惑メールが多くなると非常に煩雑な作業となる。 However, manual determination and registration in the learning DB by a user is a very complicated task when the number of spam mails increases.
またベイズ推論型迷惑メールフィルタは、学習する際に登録されたメールデータ自体を解析することから、利用者の利用方法や時間経過を要因とする判断は、学習パターンに反映されない。 In addition, since the Bayesian inference type junk mail filter analyzes the mail data itself registered at the time of learning, the judgment based on the usage method of the user and the passage of time is not reflected in the learning pattern.
そこで、本発明では、ベイズ推論型迷惑メールフィルタなどにおける学習DBへメールデータを登録する方法として、利用者が受信した電子メールに対する振る舞いから、迷惑メールであると判断し、学習DBへ自動で登録する仕組みを提供することを目的とする。 Therefore, in the present invention, as a method of registering mail data in the learning DB in a Bayesian inference type spam filter or the like, it is determined that the user is a spam mail from the behavior with respect to the received email, and is automatically registered in the learning DB. The purpose is to provide a mechanism to do this.
本発明は、受信した電子メールについてフィルタリング処理を行う情報処理装置であって、電子メールを受信するメール受信手段と、前記メール受信手段で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出手段と、前記未読メール抽出手段により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定手段と、前記未読判定手段により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成手段と、を備えることを特徴とする。 The present invention is an information processing apparatus that performs filtering processing on a received e-mail, a mail receiving unit that receives an e-mail, and an unread e-mail that extracts an unread e-mail from among e-mails received by the mail receiving unit An unread mail extracted by the extracting means, an unread mail extracted by the unread mail extracting means, an unread determining means for determining whether or not the unread mail exceeds a predetermined time, and an unread mail exceeding the predetermined time by the unread determining means. Learning DB generation means for registering the data of the e-mail as data used as a determination material for filtering if it is determined to be present.
また、本発明は、受信した電子メールについてフィルタリング処理を行う情報処理装置における情報処理方法であって、前記情報処理装置のメール受信手段が、電子メールを受信するメール受信工程と、前記情報処理装置の未読メール抽出手段が、前記メール受信工程で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出工程と、前記情報処理装置の未読判定手段が、前記未読メール抽出工程により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定工程と、前記情報処理装置の学習DB生成手段が、前記未読判定工程により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成工程と、を備えることを特徴とする。 The present invention is also an information processing method in an information processing apparatus that performs filtering processing on received electronic mail, wherein a mail reception unit of the information processing apparatus receives an electronic mail, and the information processing apparatus The unread mail extracting means extracts the unread e-mail from the e-mail received in the mail receiving process, and the unread determining means of the information processing apparatus is extracted by the unread mail extracting process. An unread determination step for determining whether or not an unread mail has been unread beyond a predetermined time, and the learning DB generation means of the information processing apparatus is unread for a predetermined time by the unread determination step. If it is determined, the learning DB generator for registering the data of the e-mail as data to be used as a determination material for filtering Characterized in that it comprises a and.
また、本発明は、受信した電子メールについてフィルタリング処理を行う情報処理装置において実行可能なプログラムであって、前記情報処理装置を、電子メールを受信するメール受信手段と、前記メール受信手段で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出手段と、前記未読メール抽出手段により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定手段と、前記未読判定手段により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成手段として機能させることを特徴とする。 Further, the present invention is a program executable in an information processing apparatus that performs filtering processing on a received electronic mail, wherein the information processing apparatus is received by a mail receiving unit that receives the electronic mail and the mail receiving unit. Unread mail extracting means for extracting unread e-mail from e-mail, and unread determining means for determining whether or not unread mail extracted by the unread mail extracting means is unread over a predetermined time; When it is determined by the unread determination means that it has not been read for a predetermined time, it functions as a learning DB generation means for registering the data of the e-mail as data as a determination material for filtering. .
本発明によれば、ベイズ推論型迷惑メールフィルタなどにおける学習DBへメールデータを登録する方法として、利用者が受信した電子メールに対する振る舞いから、迷惑メールであると判断し、学習DBへ自動で登録することが可能となる。 According to the present invention, as a method of registering mail data in the learning DB in a Bayesian inference type spam filter or the like, it is determined that the mail is spam from the behavior of the received email and is automatically registered in the learning DB. It becomes possible to do.
以下、図面を参照して、本発明の実施の形態の一例について説明する。 Hereinafter, an example of an embodiment of the present invention will be described with reference to the drawings.
図1は、本発明の情報処理システムのシステム構成図の一例を示す図である。図1に示すように、本発明の情報システムは、クライアント端末(情報処理装置)101、メールサーバ102、プロキシサーバ103を備えている。また、上記の装置は、LAN(Local Area Network)104を介して相互に通信可能に接続されている。
FIG. 1 is a diagram showing an example of a system configuration diagram of an information processing system according to the present invention. As shown in FIG. 1, the information system of the present invention includes a client terminal (information processing apparatus) 101, a
また、メールサーバ102や情報処理装置101は、プロキシサーバ103を介して広域ネットワーク105に接続されている外部メールサーバ106−1、106−2と相互に通信可能に接続されている。
Further, the
プロキシサーバ103は、メールサーバ102や情報処理装置101から送信される電子メールデータに対する中継制御処理を行うサーバ装置である。
The
メールサーバ102は、電子メールの送受信を行うために用いられるサーバ装置であって、電子メールのメールアドレス管理や、当該メールアドレスに送信されてきた電子メールを保存する等の機能を持ったサーバ装置である。
The
情報処理装置101は、電子メールの送信元端末(不図示)から送信された電子メールを受信する。
The
以下、図2を用いて、図1に示した情報処理装置101に適用可能な情報処理装置のハードウエア構成の一例について説明する。
Hereinafter, an example of the hardware configuration of the information processing apparatus applicable to the
図2において、201はCPUで、システムバス204に接続される各デバイスやコントローラを統括的に制御する。また、ROM203あるいは外部メモリ211には、CPU201の制御プログラムであるBIOS(Basic Input / Output System)やオペレーティングシステムプログラム(以下、OS)や、各サーバ或いは各PCの実行する機能を実現するために必要な各種プログラム等が記憶されている。
In FIG. 2,
202はRAMで、CPU201の主メモリ、ワークエリア等として機能する。CPU201は、処理の実行に際して必要なプログラム等をROM203あるいは外部メモリ211からRAM202にロードして、該ロードしたプログラムを実行することで各種動作を実現するものである。
A
また、205は入力コントローラで、入力装置209等からの入力を制御する。206はビデオコントローラで、液晶ディスプレイ等のディスプレイ装置210への表示を制御する。なお、ディスプレイ装置は、液晶ディスプレイに限られず、CRTディスプレイなどであっても良い。これらは必要に応じてクライアントが使用するものである。
An
207はメモリコントローラで、ブートプログラム,各種のアプリケーション,フォントデータ,ユーザファイル,編集ファイル,各種データ等を記憶するハードディスク(HD)や、フレキシブルディスク(FD)、或いはPCMCIAカードスロットにアダプタを介して接続されるコンパクトフラッシュ(登録商標)メモリ等の外部メモリ211へのアクセスを制御する。
A
208は通信I/Fコントローラで、ネットワーク(例えば、図1に示したLAN400)を介して外部機器と接続・通信するものであり、ネットワークでの通信制御処理を実行する。例えば、TCP/IPを用いた通信等が可能である。
A communication I /
なお、CPU201は、例えばRAM202内の表示情報用領域へアウトラインフォントの展開(ラスタライズ)処理を実行することにより、ディスプレイ装置210上での表示を可能としている。また、CPU201は、ディスプレイ装置210上の不図示のマウスカーソル等でのユーザ指示を可能とする。
Note that the
ハードウエア上で動作する各種プログラムは、外部メモリ211に記録されており、必要に応じてRAM202にロードされることによりCPU201によって実行されるものである。
Various programs that operate on the hardware are recorded in the
なお、全ての装置がこれらの構成を備えているわけではなく、必要なものを夫々備えていればよい。 It should be noted that not all devices have these configurations, and it is only necessary to provide necessary devices.
次に、図3を用いて、本発明の実施形態において情報処理装置101が行う学習DBへの登録処理について説明する。
Next, the registration processing to the learning DB performed by the
なお、図3のフローチャートで示す処理については、情報処理装置101のCPU201が所定の制御プログラムを読み出して実行する処理である。
Note that the process shown in the flowchart of FIG. 3 is a process in which the
ステップS301では、情報処理装置101のCPU201は、外部の送信者端末(不図示)から送信された電子メールを受信する。
In step S301, the
ステップS302では、情報処理装置101のCPU201は、ステップS301で受信した電子メールに対して迷惑メールフィルタ処理を実行する。ステップS302において用いられる迷惑メールフィルタは、ステップS406で学習DBに登録されたデータをもとに判断を行うものである。この処理により、受信した電子メールが迷惑メールであると判断された場合は、当該電子メールは削除等の処理がなされる。
In step S302, the
ステップS302における迷惑メールフィルタリング処理については、プロキシサーバ103において実行されてもよい。この場合、ステップS301でプロキシサーバ103が電子メールを受信し、当該受信した電子メールに対してプロキシサーバ103が迷惑メールフィルタリング処理を実行し、迷惑メールではないと判定された電子メールを情報処理装置101に配送する。
The spam mail filtering process in step S302 may be executed in the
次に、図4を用いて、本発明の実施形態において情報処理装置101が行う学習DBへの登録処理の第1の実施形態について説明する。
Next, a first embodiment of the registration process to the learning DB performed by the
学習DBについては、情報処理装置101に記憶されていても、プロキシサーバ103に記憶されていても良い。
The learning DB may be stored in the
なお、図4のフローチャートに示す処理については、情報処理装置101のCPU201が所定の制御プログラムを読み出して実行する処理である。
Note that the process shown in the flowchart of FIG. 4 is a process in which the
ステップS401では、情報処理装置101のCPU201は、ステップS302で迷惑メールであると判断されなかった電子メールのうち、未読である電子メールを抽出する。
In step S401, the
そして、ステップS403〜S406に示す処理をステップS401で抽出した未読メール毎に実行する(ステップS402)。 Then, the processing shown in steps S403 to S406 is executed for each unread mail extracted in step S401 (step S402).
ステップS402では、情報処理装置101のCPU201は、ステップS401で抽出された電子メールが所定の期間未読状態が続いたか否かを判断する。ここで判断基準となる所定期間については、図6または図7に示すテーブルに設定された情報を用いて判断する。なお、図6、図7に示すテーブルは、不図示の設定画面を介してユーザから設定を受け付けることで作成される。
In step S402, the
また具体的な判断方法については、当該電子メールの受信時刻と現在時刻とを比較する方法によるが、この方法に限られずいずれの方法でも良い。
ここで、図6について説明する。
The specific determination method is based on a method of comparing the reception time of the e-mail and the current time, but is not limited to this method, and any method may be used.
Here, FIG. 6 will be described.
図6は、電子メールを受信した時間帯ごとに迷惑メールであると判定される(ステップS403でYESと判定される)未読時間に違いを持たせる場合に用いられる。 FIG. 6 is used when there is a difference in the unread time that is determined to be junk mail (determined as YES in step S403) for each time period when the e-mail is received.
例えば図6の例では、0:00〜05:00の間に受信した電子メールについては、24時間以上未読期間があった場合には、迷惑メールであると判定される(ステップS403においてYESと判定される)。また05:00〜24:00の間に受信した電子メールについては、48時間以上未読期間があった場合に迷惑メールであると判定される(ステップS403でYESと判定される)ことを示す。 For example, in the example of FIG. 6, if an e-mail received between 0:00 and 05:00 has an unread period of 24 hours or more, it is determined to be a junk mail (YES in step S403). Determined). Further, it is determined that an e-mail received between 05:00 and 24:00 is determined to be a spam mail when there is an unread period of 48 hours or more (YES is determined in step S403).
このように電子メールを受信した時間帯によって未読期間に違いを持たせることで、より適切な判定が可能となる。すなわち、例えば、夜中の3時にビジネスメールが送られてくることは稀であると言えるため、夜中の3時に受信した電子メールについては業務とは関係のないメールである可能性が高い。そのようなメールについては早めに迷惑メールであると判定することで、より適切な統計をとることが可能となる。 As described above, by making a difference in the unread period depending on the time zone when the electronic mail is received, a more appropriate determination can be made. That is, for example, it can be said that a business mail is rarely sent at 3 o'clock in the middle of the night. Therefore, an e-mail received at 3 o'clock in the middle of the night is highly likely to be unrelated to business. By determining that such mail is a junk mail at an early stage, more appropriate statistics can be obtained.
逆に、日中に受信した電子メールについては、業務と関係のある電子メールであることが多いといえる。そのため、そのような電子メールについてはある程度未読期間がであっても、受信者にとって必要な電子メールである可能性があるため、迷惑メールであるとの判断をさせないようにする必要がある。 On the other hand, it can be said that e-mails received during the day are often related to business. Therefore, even if there is a certain unread period for such an e-mail, there is a possibility that it is an e-mail necessary for the recipient, so it is necessary not to judge that it is a junk mail.
以上のことから、図6のように電子メールを受信した時間帯によって迷惑メールと判定されるまでの未読期間に違いを持たせることが必要となる。
次に図7について説明する。
From the above, it is necessary to make a difference in the unread period until it is determined to be spam mail depending on the time zone when the electronic mail is received as shown in FIG.
Next, FIG. 7 will be described.
図7は、電子メールを受信した曜日ごとに迷惑メールであると判定される(ステップS403でYESであると判定される)未読時間に違いを持たせる場合に用いられる。 FIG. 7 is used when there is a difference in unread time that is determined to be junk mail (determined as YES in step S403) for each day of the week when an e-mail is received.
例えば図7の例では、月曜日〜木曜日に受信した電子メールについては、24時間以上未読であってメールについて、迷惑メールであると判定される(ステップS403でYESと判定される)。 For example, in the example of FIG. 7, the e-mail received from Monday to Thursday is unread for 24 hours or more, and the e-mail is determined to be spam (determined as YES in step S403).
また、金曜日に受信した電子メールについては96時間、土曜日に受信した電子メールについては72時間、日曜日に受信した電子メールについては48時間以上未読であったメールについて、迷惑メールであると判定される(ステップS403でYESと判定される)ことを示す。 Further, it is determined that the e-mail received on Friday is 96 hours, the e-mail received on Saturday is 72 hours, and the e-mail received on Sunday is unread for 48 hours or more. (Determined as YES in step S403).
このように曜日によって迷惑メールであると判定されるまでの時間に違いを持たせることで、図6に示した場合と同様、適切な判定が可能となる。 As described above, by making a difference in the time until it is determined to be spam mail depending on the day of the week, an appropriate determination can be made as in the case shown in FIG.
すなわち、例えば金曜日に受信した電子メールについては、金曜日に開封しなかった場合、翌週の月曜日に開封することが多いと考えられる(土日は休業であるため)。このような場合に、金曜日に受信した電子メールについても一律に迷惑メールであると判定される未読期間を決めてしまうと、必要なメールであるにもかかわらず迷惑メールと判定されてしまうことになる。 That is, for example, if an e-mail received on Friday is not opened on Friday, it is likely to be opened on Monday of the next week (since Saturday and Sunday are closed). In such a case, if an e-mail received on Friday is uniformly determined as an unread period that is determined to be spam, it will be determined as spam even though it is a necessary mail. Become.
このようなケースを想定して、図7のように電子メールを受信した曜日に応じて迷惑メールと判定されるまでの未読時間に違いを持たせることが必要となる。
図4の説明に戻る。
Assuming such a case, as shown in FIG. 7, it is necessary to have a difference in the unread time until it is determined to be junk mail according to the day of the week when the electronic mail is received.
Returning to the description of FIG.
所定期間未読状態である場合(ステップS402:YES)は、処理をステップS403に移行する。 If it has not been read for a predetermined period (step S402: YES), the process proceeds to step S403.
未読状態が所定の期間に達していない場合(ステップS402:NO)は、処理をステップS402に戻し、ステップS401で抽出された他の電子メールに対する処理を実行する。 If the unread state has not reached the predetermined period (step S402: NO), the process returns to step S402, and the process for the other electronic mail extracted in step S401 is executed.
ステップS404では、情報処理装置101のCPU201は、処理対象の電子メールと同一の送信元からの電子メールを受信したことがあるか否かを判断する。ステップS404における処理は、いわゆるメールマガジンなどで未読のものを学習DBに登録しないようにするための処理である。メールマガジンなどは未読であることが多いが、必ずしもメールマガジンが迷惑メールとは判断できないために実行される処理である。
In step S404, the
同一の送信元からの電子メールを受信していた場合(ステップS404:YES)は、処理をステップS402に戻し、ステップS401で抽出された他の電子メールに対する処理を実行する。 If an e-mail from the same transmission source has been received (step S404: YES), the process returns to step S402, and the process for the other e-mail extracted in step S401 is executed.
同一の送信元からの電子メールを受信していない場合(ステップS404:NO)は、処理をステップS405に移行する。 If an e-mail from the same sender has not been received (step S404: NO), the process proceeds to step S405.
ステップS405では、情報処理装置101のCPU201は、処理対象の電子メールと同一または類似の件名の電子メールを受信したことがあるか否かを判断する。ステップS405における処理についても、メールマガジンなどを想定した処理である。
In step S405, the
同一または類似の件名の電子メールを受信したことがあると判断された場合(ステップS405:YES)は、処理をステップS402に戻し、ステップS401で抽出された他の電子メールに対する処理を実行する。 If it is determined that an e-mail with the same or similar subject has been received (step S405: YES), the process returns to step S402, and the process for the other e-mail extracted in step S401 is executed.
同一または類似の件名の電子メールを受信したことがないと判断された場合(ステップS405:NO)は、処理をステップS406に移行する。 If it is determined that an e-mail with the same or similar subject has not been received (step S405: NO), the process proceeds to step S406.
ステップS406では、情報処理装置101のCPU201は、処理対象となっている電子メールデータを学習DBへ登録する。
In step S406, the
ここで、学習DBが情報処理装置101にある場合は、当該電子メールデータを情報処理装置101の学習DBに登録し、学習DBがプロキシサーバ103にある場合は、当該電子メールデータをプロキシサーバ103に送信し、プロキシサーバ103が登録する。
Here, when the learning DB is in the
そして、処理をステップS402に戻し、ステップS401で抽出された他の電子メールに対する処理を実行する。 Then, the process returns to step S402, and the process for the other electronic mail extracted in step S401 is executed.
ステップS401で抽出された電子メールの全てについてステップS403〜S406の処理が実行されると、本フローチャートの処理を終了する。 When the processes in steps S403 to S406 are executed for all the emails extracted in step S401, the process of this flowchart is terminated.
なお、情報処理装置101のCPU201は、図4のフローチャートに示す処理を常時行っている。
Note that the
次に、図5を用いて、本発明の実施形態において情報処理装置101が行う学習DBへの登録処理の第2の実施形態について説明する。
Next, a second embodiment of the registration process to the learning DB performed by the
なお、図5のフローチャートに示す処理については、情報処理装置101のCPU201が所定の制御プログラムを読み出して実行する処理である。
Note that the processing shown in the flowchart of FIG. 5 is processing in which the
また、図5のフローチャートに示す処理のうち、図4のフローチャートの処理と同じ処理(ステップS401〜S403、S406)については、説明を省略する。ここでは、図4とは異なる処理であるステップS504の処理について説明する。 Further, among the processes shown in the flowchart of FIG. 5, the same processes (steps S401 to S403 and S406) as those of the flowchart of FIG. 4 are not described. Here, the process of step S504, which is a process different from FIG. 4, will be described.
ステップS504では、情報処理装置101のCPU201は、処理対象の電子メールではない他の電子メールも未読であるか否かを判断する。
In step S504, the
他の電子メールも未読であると判断された場合(ステップS504:YES)は、処理をステップS402に戻し、ステップS401で抽出された他の電子メールに対する処理を実行する。 If it is determined that another e-mail has not been read (step S504: YES), the process returns to step S402, and the process for the other e-mail extracted in step S401 is executed.
他の電子メールは未読ではないと判断された場合(ステップS504:NO)は、処理をステップS406に移行する。 If it is determined that another electronic mail is not unread (step S504: NO), the process proceeds to step S406.
ステップS504のように、他の電子メールも未読であるか否かを判断することにより、例えば休暇に入ったため受診済みメールを未読であったという場合などにも適切に迷惑メールであるか否かの判断が可能となる。すなわち、休暇に入った場合、本来は迷惑メールではない電子メールについても未読のまま長時間放置されることとなる。このような場合にも当該電子メールを迷惑メールであると判断されてしまうのは適切な判断とはいえないため、処理対象の電子メールの前後一定期間に受信した電子メールも未読である場合には、休暇などにより未読であると判断することで、迷惑メールと判定しないようにすることが可能となる。 By determining whether other e-mails are unread as in step S504, for example, whether it is an unsolicited e-mail even if the received mail has not been read because of a vacation. Can be determined. That is, when a vacation is entered, an e-mail that is not originally a junk mail is left unread for a long time. Even in such a case, it is not an appropriate decision to determine that the e-mail is spam. If e-mail received for a certain period before or after the e-mail to be processed is also unread Can be determined not to be spam mail by determining that it is unread due to vacation or the like.
また、迷惑メールについては、短期間で大量の電子メールを送りつけてくるケースも想定される。このような場合には上述の方法で対処すると、迷惑メールではないと判定される可能性もあり適切ではなくなる。 As for junk mail, a large number of e-mails may be sent in a short period of time. If such a case is dealt with by the above-described method, it may be determined that the message is not spam and is not appropriate.
そこで、処理対象の電子メールの前後一定期間に受信した電子メールのうち、処理対象の電子メールの送信元とは異なる送信元から送信された電子メールが未読であるか否かを判断するようにすることで、上述の不都合を解消することが可能となる。 Therefore, it is determined whether or not an e-mail transmitted from a transmission source different from the transmission source of the e-mail to be processed is unread among e-mails received in a certain period before and after the e-mail to be processed. By doing so, it becomes possible to eliminate the above-mentioned inconvenience.
また、送信元での判断以外にも、処理対象の電子メールの件名とは類似しない件名の電子メールついて未読か否かを判断することによっても可能である。 In addition to the determination at the transmission source, it is also possible to determine whether or not an email with a subject that is not similar to the subject of the email to be processed is unread.
以上の処理により、ベイズ推論型迷惑メールフィルタなどにおける学習DBへメールデータを登録する方法として、利用者が受信した電子メールに対する振る舞いから、迷惑メールであると判断し、学習DBへ自動で登録することが可能となる。 With the above processing, as a method of registering mail data in the learning DB in the Bayesian inference type spam filter or the like, it is determined that it is a spam mail from the behavior with respect to the email received by the user, and is automatically registered in the learning DB. It becomes possible.
なお、上述した各種データの構成及びその内容はこれに限定されるものではなく、用途や目的に応じて、様々な構成や内容で構成されることは言うまでもない。 It should be noted that the configuration and contents of the various data described above are not limited to this, and it goes without saying that the various data and configurations are configured according to the application and purpose.
また、本発明におけるプログラムは、図3〜図5の処理方法をコンピュータが実行可能なプログラムである。なお、本発明におけるプログラムは図3〜図5の各装置の処理方法ごとのプログラムであってもよい。 Moreover, the program in this invention is a program which a computer can perform the processing method of FIGS. The program in the present invention may be a program for each processing method of each apparatus in FIGS.
以上のように、前述した実施形態の機能を実現するプログラムを記録した記録媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記録媒体に格納されたプログラムを読み出し、実行することによっても本発明の目的が達成されることは言うまでもない。 As described above, a recording medium that records a program that implements the functions of the above-described embodiments is supplied to a system or apparatus, and a computer (or CPU or MPU) of the system or apparatus stores the program stored in the recording medium. It goes without saying that the object of the present invention can also be achieved by reading and executing.
この場合、記録媒体から読み出されたプログラム自体が本発明の新規な機能を実現することになり、そのプログラムを記録した記録媒体は本発明を構成することになる。 In this case, the program itself read from the recording medium realizes the novel function of the present invention, and the recording medium recording the program constitutes the present invention.
プログラムを供給するための記録媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、DVD−ROM、磁気テープ、不揮発性のメモリカード、ROM、EEPROM、シリコンディスク等を用いることが出来る。 As a recording medium for supplying the program, for example, a flexible disk, hard disk, optical disk, magneto-optical disk, CD-ROM, CD-R, DVD-ROM, magnetic tape, nonvolatile memory card, ROM, EEPROM, silicon A disk or the like can be used.
また、コンピュータが読み出したプログラムを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Further, by executing the program read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) operating on the computer based on an instruction of the program is actually It goes without saying that a case where the function of the above-described embodiment is realized by performing part or all of the processing and the processing is included.
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。 Furthermore, after the program read from the recording medium is written to the memory provided in the function expansion board inserted into the computer or the function expansion unit connected to the computer, the function expansion board is based on the instructions of the program code. It goes without saying that the case where the CPU or the like provided in the function expansion unit performs part or all of the actual processing and the functions of the above-described embodiments are realized by the processing.
また、本発明は、複数の機器から構成されるシステムに適用しても、ひとつの機器から成る装置に適用しても良い。また、本発明は、システムあるいは装置にプログラムを供給することによって達成される場合にも適応できることは言うまでもない。この場合、本発明を達成するためのプログラムを格納した記録媒体を該システムあるいは装置に読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。 The present invention may be applied to a system constituted by a plurality of devices or an apparatus constituted by a single device. Needless to say, the present invention can be applied to a case where the present invention is achieved by supplying a program to a system or apparatus. In this case, by reading a recording medium storing a program for achieving the present invention into the system or apparatus, the system or apparatus can enjoy the effects of the present invention.
さらに、本発明を達成するためのプログラムをネットワーク上のサーバ、データベース等から通信プログラムによりダウンロードして読み出すことによって、そのシステムあるいは装置が、本発明の効果を享受することが可能となる。なお、上述した各実施形態およびその変形例を組み合わせた構成も全て本発明に含まれるものである。 Furthermore, by downloading and reading a program for achieving the present invention from a server, database, etc. on a network using a communication program, the system or apparatus can enjoy the effects of the present invention. In addition, all the structures which combined each embodiment mentioned above and its modification are also included in this invention.
101 情報処理装置
102 メールサーバ
103 プロキシサーバ
104 LAN
105 広域ネットワーク
106 外部メールサーバ
101
105 Wide area network 106 External mail server
Claims (6)
電子メールを受信するメール受信手段と、
前記メール受信手段で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出手段と、
前記未読メール抽出手段により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定手段と、
前記未読判定手段により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成手段と、
を備えることを特徴とする情報処理装置。 An information processing apparatus that performs filtering processing on received emails,
Mail receiving means for receiving e-mail;
Unread mail extracting means for extracting unread e-mail from e-mail received by the mail receiving means;
Unread determination means for determining whether or not unread mail extracted by the unread mail extraction means has been unread beyond a predetermined time;
A learning DB generating means for registering the data of the e-mail as data to be used as a determination material for filtering when the unread determination means determines that the data has not been read for a predetermined time;
An information processing apparatus comprising:
前記学習DB生成手段は、前記他メール状態判定手段により当該未読メール以外の電子メールも未読であると判定された場合は、当該未読メールのデータをフィルタリングのための判断材料とするデータとして登録しないことを特徴とする請求項1に記載の情報処理装置。 The e-mail other than the unread e-mail that has been determined to be unread after a predetermined time by the unread determination unit further includes another mail status determination unit that determines whether or not it is in an unread state.
The learning DB generation means does not register the data of the unread mail as data used as a judgment material for filtering when the other mail status determination means determines that an electronic mail other than the unread mail is also unread. The information processing apparatus according to claim 1.
前記情報処理装置のメール受信手段が、電子メールを受信するメール受信工程と、
前記情報処理装置の未読メール抽出手段が、前記メール受信工程で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出工程と、
前記情報処理装置の未読判定手段が、前記未読メール抽出工程により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定工程と、
前記情報処理装置の学習DB生成手段が、前記未読判定工程により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成工程と、
を備えることを特徴とする情報処理方法。 An information processing method in an information processing apparatus that performs filtering processing on received e-mail,
A mail receiving step in which the mail receiving means of the information processing apparatus receives an e-mail;
An unread mail extracting unit of the information processing apparatus extracts an unread e-mail out of the e-mails received in the mail receiving process; and
The unread determination unit of the information processing apparatus determines whether the unread mail extracted by the unread mail extraction step is unread beyond a predetermined time; and
Learning in which the learning DB generating means of the information processing apparatus registers the data of the e-mail as data to be used as a determination material for filtering when it is determined by the unread determination step that the data has not been read for a predetermined time. DB generation process;
An information processing method comprising:
前記情報処理装置を、
電子メールを受信するメール受信手段と、
前記メール受信手段で受信した電子メールのうち未読の電子メールを抽出する未読メール抽出手段と、
前記未読メール抽出手段により抽出された未読メールについて、所定の時間を超えて未読であるか否かを判断する未読判定手段と、
前記未読判定手段により所定の時間を超えて未読であると判定された場合、当該電子メールのデータをフィルタリングのための判断材料とするデータとして登録する学習DB生成手段として機能させることを特徴とするプログラム。
A program that can be executed in an information processing apparatus that performs filtering processing on a received email,
The information processing apparatus;
Mail receiving means for receiving e-mail;
Unread mail extracting means for extracting unread e-mail from e-mail received by the mail receiving means;
Unread determination means for determining whether or not unread mail extracted by the unread mail extraction means has been unread beyond a predetermined time;
When it is determined by the unread determination means that it has not been read for a predetermined time, it functions as a learning DB generation means for registering the data of the e-mail as data as a determination material for filtering. program.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011280264A JP5870677B2 (en) | 2011-12-21 | 2011-12-21 | Information processing apparatus, information processing method, and program |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011280264A JP5870677B2 (en) | 2011-12-21 | 2011-12-21 | Information processing apparatus, information processing method, and program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2013131048A true JP2013131048A (en) | 2013-07-04 |
JP5870677B2 JP5870677B2 (en) | 2016-03-01 |
Family
ID=48908545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2011280264A Active JP5870677B2 (en) | 2011-12-21 | 2011-12-21 | Information processing apparatus, information processing method, and program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5870677B2 (en) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016220050A (en) * | 2015-05-21 | 2016-12-22 | 京セラドキュメントソリューションズ株式会社 | Image formation device |
JP2018041242A (en) * | 2016-09-07 | 2018-03-15 | サクサ株式会社 | Email monitoring device |
JP2019066921A (en) * | 2017-09-28 | 2019-04-25 | キヤノンマーケティングジャパン株式会社 | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING SYSTEM, CONTROL METHOD, AND PROGRAM |
CN114510200A (en) * | 2020-11-17 | 2022-05-17 | 株式会社理光 | Information processing apparatus, storage medium, and method of recommending rejected facsimile number |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1115756A (en) * | 1997-06-24 | 1999-01-22 | Omron Corp | Electronic mail discrimination method, device, therefor and storage medium |
JP2000353133A (en) * | 1999-04-09 | 2000-12-19 | Internatl Business Mach Corp <Ibm> | System and method for disturbing undesirable transmission or reception of electronic message |
JP2002063115A (en) * | 2000-08-16 | 2002-02-28 | Nippon Telegr & Teleph Corp <Ntt> | Receiving device, sending device, and e-mail system in e-mail system |
JP2004259294A (en) * | 2004-04-12 | 2004-09-16 | Just Syst Corp | E-mail transmission / reception device, e-mail transmission / reception system, e-mail transmission / reception method, program for causing computer to execute e-mail transmission / reception method, and computer-readable recording medium recording the program |
-
2011
- 2011-12-21 JP JP2011280264A patent/JP5870677B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH1115756A (en) * | 1997-06-24 | 1999-01-22 | Omron Corp | Electronic mail discrimination method, device, therefor and storage medium |
US6199103B1 (en) * | 1997-06-24 | 2001-03-06 | Omron Corporation | Electronic mail determination method and system and storage medium |
JP2000353133A (en) * | 1999-04-09 | 2000-12-19 | Internatl Business Mach Corp <Ibm> | System and method for disturbing undesirable transmission or reception of electronic message |
JP2002063115A (en) * | 2000-08-16 | 2002-02-28 | Nippon Telegr & Teleph Corp <Ntt> | Receiving device, sending device, and e-mail system in e-mail system |
JP2004259294A (en) * | 2004-04-12 | 2004-09-16 | Just Syst Corp | E-mail transmission / reception device, e-mail transmission / reception system, e-mail transmission / reception method, program for causing computer to execute e-mail transmission / reception method, and computer-readable recording medium recording the program |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2016220050A (en) * | 2015-05-21 | 2016-12-22 | 京セラドキュメントソリューションズ株式会社 | Image formation device |
JP2018041242A (en) * | 2016-09-07 | 2018-03-15 | サクサ株式会社 | Email monitoring device |
JP2019066921A (en) * | 2017-09-28 | 2019-04-25 | キヤノンマーケティングジャパン株式会社 | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING SYSTEM, CONTROL METHOD, AND PROGRAM |
CN114510200A (en) * | 2020-11-17 | 2022-05-17 | 株式会社理光 | Information processing apparatus, storage medium, and method of recommending rejected facsimile number |
Also Published As
Publication number | Publication date |
---|---|
JP5870677B2 (en) | 2016-03-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102067366B1 (en) | Time-managed electronic mail messages | |
US8561163B2 (en) | Maintaining the integrity of email authorship | |
JP2010146112A (en) | Information processor, control method therefor, program and recording medium | |
JP5870677B2 (en) | Information processing apparatus, information processing method, and program | |
JP5307281B2 (en) | Information processing apparatus, control method therefor, and program | |
JP6871503B2 (en) | Information processing equipment, control methods, and programs | |
US8819147B2 (en) | Electronic mail receiving apparatus | |
JP7159115B2 (en) | Program, information processing method and information processing apparatus | |
JP6558478B2 (en) | Information processing apparatus, control method, and program | |
JP6327623B2 (en) | Information processing apparatus, control method for information processing apparatus, and program | |
JP5081287B2 (en) | Information processing apparatus, control method therefor, and program | |
JP5065462B2 (en) | Information processing apparatus, control method therefor, and program | |
JP6545859B2 (en) | PROGRAM, INFORMATION PROCESSING APPARATUS, AND CONTROL METHOD OF INFORMATION PROCESSING APPARATUS | |
JP5352783B2 (en) | Information processing apparatus, control method therefor, and program | |
JP2019197583A (en) | Information processing device, control method, and program | |
JP2016118843A (en) | Information processing device, control method, and program | |
JP2011071999A (en) | Information processing apparatus, information processing method, and program | |
JP2013030126A (en) | Information processor, information processing method, and program | |
JP2012108705A (en) | Information processing device and information processing method, program and storage medium thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20130531 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20130531 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20141212 |
|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20150410 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20150924 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20150929 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20151130 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20151215 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20151228 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5870677 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |