JP2010010859A - Storage method of e-mail, and system therefor - Google Patents
Storage method of e-mail, and system therefor Download PDFInfo
- Publication number
- JP2010010859A JP2010010859A JP2008165307A JP2008165307A JP2010010859A JP 2010010859 A JP2010010859 A JP 2010010859A JP 2008165307 A JP2008165307 A JP 2008165307A JP 2008165307 A JP2008165307 A JP 2008165307A JP 2010010859 A JP2010010859 A JP 2010010859A
- Authority
- JP
- Japan
- Prior art keywords
- data
- storage area
- same content
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
Description
本発明は、メールサーバにおいて電子メールを保管する場合の電子メールの蓄積方法およびそのシステムに関するものである。 The present invention relates to an e-mail storage method and system for storing e-mail in a mail server.
従来、自分宛に届いた電子メール(以後、eメールと呼称する。)は、個人所有のコンピュータ等の情報端末に配信サーバからメッセージをダウンロードして閲覧する方法が一般的であった。しかし、この方法では、eメールの内容を閲覧するために個人所有の情報端末を常に携帯しなければならないという問題が生じていた。 Conventionally, an electronic mail (hereinafter referred to as “e-mail”) delivered to oneself is generally downloaded by a message from a distribution server to an information terminal such as a personally owned computer. However, this method has a problem that it is necessary to always carry a personal information terminal in order to view the contents of the e-mail.
また、上記の方法では、新しいeメールを受け取るために情報端末を配信サーバに接続する必要がある。安全性を考慮すると、配信サーバへの接続は、安全性の確認されたネットワーク内からのもののみを許可するといったように、なんらかの対策処置を講じる必要がある。そのため、利用者が許可範囲外のネットワーク環境にいる場合には、新しいeメールを受け取り閲覧することができないという問題も生じていた。 In the above method, it is necessary to connect the information terminal to the distribution server in order to receive a new e-mail. In consideration of safety, it is necessary to take some countermeasures such as permitting connection to the distribution server only from within the network where the security is confirmed. Therefore, when the user is in a network environment outside the permitted range, there has been a problem that new e-mails cannot be received and viewed.
これらの問題を解消するため、eメールをあるメールサーバに保管し、ネットワークに自由に接続するWeb(world wide web:WWW)インタフェースを用いて利用者宛てのメールを閲覧させるサービス、すなわち、Webメールサービスまたはフリーメールサービスが考案された。このサービスでは、利用者は、Webインタフェースを通じ、各人に配布される利用者名とパスワード等の組み合わせによる認証を経てメールサーバにログインし、個人宛のeメールを閲覧することができる。この場合、eメールはメールサーバに保存されているため、利用者が手元で操作する情報端末は、WebインタフェースとWeb用の通信手段とを備えてさえいればどのような端末でもよく、個人所有の情報端末を持ち歩く必要はない。また、Web用の通信手段は不特定多数からのアクセスを考慮して設計されているため、メールサーバの安全性を確保するために接続元に制限を設ける必要がなく、利用者はどのようなネットワーク環境にいても最新のeメールを閲覧することができるという利点がある。 In order to solve these problems, a service for storing e-mails on a mail server and browsing mails to users using a Web (world wide web: WWW) interface that is freely connected to the network, that is, Web mail A service or free mail service was devised. With this service, a user can log in to a mail server through an authentication based on a combination of a user name and a password distributed to each person through a Web interface, and browse an e-mail addressed to an individual. In this case, since the e-mail is stored in the mail server, the information terminal operated by the user can be any terminal as long as it has a web interface and web communication means. There is no need to carry the information terminal. Moreover, since the communication means for Web is designed in consideration of access from an unspecified number of people, there is no need to limit the connection source in order to ensure the safety of the mail server. There is an advantage that the latest e-mail can be viewed even in a network environment.
上記サービスは、利用者側から見た場合このように優れた利点を持つが、サービス提供者側から見た場合、全利用者宛てのeメールを保存するための大きな容量の格納領域を準備しなければならないという問題が生じる。上記のサービスでは、サーバに保存されているeメールは利用者ごとに区分けされた領域に保存されている。よって、サービス提供者は、サービス提供者が設定した利用者ごとの格納領域容量に、利用者数を乗じた容量の格納領域を用意しなければならない。つまり、より多くの利用者にサービスを提供するためには、利用者数に比例して格納領域容量を拡大しなくてはならない。また、サービスの質を向上させ利用者の満足度を高めるためには利用者ごとの格納領域容量をなるべく大きくする必要があるが、これも確保すべき格納領域容量を増加させる原因となる。格納領域容量の増加はサービスを提供するためのコストを増加させる。このように従来の方法には、より多くの利用者へ、より質の高いサービスを提供しようとすると、爆発的なコストの増加を招くという問題があった。 The above services have such excellent advantages when viewed from the user side, but when viewed from the service provider side, a large storage area is provided for storing e-mails addressed to all users. The problem of having to occur arises. In the above service, the e-mail stored in the server is stored in an area divided for each user. Therefore, the service provider must prepare a storage area having a capacity obtained by multiplying the storage area capacity for each user set by the service provider by the number of users. That is, in order to provide services to more users, the storage area capacity must be expanded in proportion to the number of users. In addition, in order to improve the quality of service and increase user satisfaction, it is necessary to increase the storage area capacity for each user as much as possible. This also causes an increase in the storage area capacity to be secured. Increasing storage capacity increases the cost of providing services. As described above, the conventional method has a problem in that an attempt to provide a higher quality service to more users causes an explosive increase in cost.
この問題は、近年いくつかの要因によって更に深刻さを増している。その一つがいわゆる「迷惑メール」呼ばれるものである。迷惑メールは、何らかの方法で取得したか、あるいは乱数的に生成した多数のメールアドレスに対して送信されるeメールである。迷惑メールは、商業的な宣伝等を内容とする同一文面のeメールが、極めて多数の宛て先に送信されるという特徴を有している。あるeメールが迷惑メールかどうかを判定するためのソフトウェアも存在するが完全ではなく、メールサービスの提供者は、迷惑メールと思しき大量のeメールによって格納領域の容量を圧迫するような状況に陥ったとしても、eメールを削除してよいかどうかは各利用者の判断に委ねるほかはない。大量の迷惑メールが配信される状況においても利用者が真に必要なeメールをWebメールサービスで閲覧できるようにするためには、やはりメールサーバの格納領域の容量を大きくしなければならない。 This problem has become more serious in recent years due to several factors. One of them is the so-called “junk mail”. The junk mail is an e-mail transmitted to a large number of e-mail addresses obtained by some method or randomly generated. Spam mail has the characteristic that e-mails with the same text containing commercial advertisements and the like are transmitted to a large number of destinations. There is software for determining whether an e-mail is spam, but it is not perfect, and the mail service provider falls into a situation where it seems that it is spam and a large amount of e-mail presses the storage space. Even so, it is up to each user to decide whether or not to delete the email. Even in a situation where a large amount of junk mail is distributed, in order to allow a user to browse a truly necessary e-mail with the Web mail service, the capacity of the mail server storage area must still be increased.
もう一つの要因としては、eメールに添付されるデータ、いわゆる「添付ファイル」として、大きなサイズのファイルが添付されるようになってきたことが挙げられる。近年では、デジタルカメラ、デジタルビデオカメラ等のマルチメディア機器の普及が著しい。かつ、近年のパーソナルコンピュータは、これらの機器によって作成されたマルチメディアデータを手軽に扱えるほどの高い性能を有している。その結果、これらマルチメディアデータがeメールの添付ファイルとして日常的にやり取りされるまでになった。一般にマルチメディアデータのサイズは非常に大きいが、近年のデジタルカメラ、デジタルビデオカメラ等の著しい高画質化により、データのサイズは更に大きさを増している。そのため、これらマルチメディアデータが添付されたeメールは、メールサーバの格納領域容量を圧迫する一因となっている。 Another factor is that large-sized files have come to be attached as data attached to e-mails, so-called “attached files”. In recent years, multimedia devices such as digital cameras and digital video cameras have been widely used. Moreover, recent personal computers have high performance that can easily handle multimedia data created by these devices. As a result, these multimedia data have been exchanged on a daily basis as email attachments. In general, the size of multimedia data is very large, but the size of data is further increased due to the recent remarkable improvement in image quality of digital cameras, digital video cameras, and the like. For this reason, the e-mail attached with the multimedia data is one of the factors that press the storage area capacity of the mail server.
メールサーバの格納領域容量を圧迫する要因としては、更に、eメールの返信における全文引用の問題がある。例えば図1に示されるように、受け取ったeメールに対する返信メールは、元のeメールの全文を本文末に引用として残して作成されることが多い。この方法では、eメールのやり取りを行うたびに本文がどんどん大きくなり、それらを保存しておかなければならないメールサーバの格納領域容量を圧迫する。 As a factor that compresses the storage area capacity of the mail server, there is a problem of full-text citation in the reply of the e-mail. For example, as shown in FIG. 1, a reply mail for a received e-mail is often created by leaving the full text of the original e-mail as a quote at the end of the text. In this method, each time an e-mail is exchanged, the body text grows larger, and the storage area capacity of the mail server that must store them is squeezed.
ユーザ端末でのこの改善策として、例えば、特開2000−194617号公報(特許文献1)に記載された技術がある。この特許文献1では、eメール受信の際、返信等に含まれる重複するメール内容を検出し、その重複するメール内容をeメールの格納領域から消去している。具体的には、メールの「subject」部分が「Re: ・・・・」として一致していることにより、その機能を実行している。
As an improvement measure for the user terminal, for example, there is a technique described in Japanese Patent Laid-Open No. 2000-194617 (Patent Document 1). In
また、例えば、特開2003−32307号公報(特許文献2)では、メールサーバが添付ファイルを有する受信メールに対して、メール本文と添付ファイルの概要情報を受信端末へ送信し、受信側から送信要求を受けた場合のみ、添付ファイルを送信することにより、ユーザ端末のメール格納領域容量を低減させている。 Also, for example, in Japanese Patent Application Laid-Open No. 2003-32307 (Patent Document 2), for a received mail in which a mail server has an attached file, the mail text and the summary information of the attached file are sent to the receiving terminal and sent from the receiving side. Only when a request is received, the mail storage area capacity of the user terminal is reduced by transmitting the attached file.
これらのメール格納領域の容量低減対策は、ユーザ側の端末が対象であり、上述したメールサーバ、特にWEbメールサービスにおけるメール格納領域の容量低減を対象にしていない。 These measures for reducing the capacity of the mail storage area are for the terminal on the user side, and are not intended for reducing the capacity of the mail storage area in the above-described mail server, particularly the WEB mail service.
解決しようとする課題は、Webメールサービスで、より多くの利用者へより利便性の高いサービスを提供しようとした場合、メールサーバのメール格納領域容量が増大するため、サービス提供者が負担すべきコストが爆発的に増加するという問題にある。 The problem to be solved is to be borne by the service provider because the mail storage area capacity of the mail server increases when trying to provide a more convenient service to more users with the Web mail service. The problem is that the cost increases explosively.
Web用の通信手段は不特定多数からの接続を考慮して設計されているので、ネットワークに対して接続制限を設けていない。つまり、Webメールサービスの利用者は、どのようなネットワーク環境からでも最新のメールを閲覧できるということである。したがって、利用者宛てのメールをサーバに全て保管しておく必要がある。そのため、サービス提供者は、全利用者宛ての全てのメールを保存しておくに足る容量の格納領域を用意する必要がある。各利用者に許される保管容量はサービス提供者側で設定することができるが、利用者の利便性を考えると容量は大きければ大きいほど好ましい。各利用者用の保管容量と提供者が用意すべき格納領域の容量は比例関係にある。また、利用者の数とも比例関係にある。すなわち、メール格納領域の容量の増加は、サービス提供者が負担すべきコストの増大を招くことになる。 Since the communication means for Web is designed in consideration of connections from an unspecified number, no connection restriction is provided for the network. That is, the user of the Web mail service can view the latest mail from any network environment. Therefore, it is necessary to store all mail addressed to the user on the server. Therefore, the service provider needs to prepare a storage area having a capacity sufficient to store all mails addressed to all users. The storage capacity allowed for each user can be set on the service provider side, but the larger the capacity, the better for the convenience of the user. The storage capacity for each user is proportional to the capacity of the storage area to be prepared by the provider. It is also proportional to the number of users. That is, an increase in the capacity of the mail storage area causes an increase in cost that the service provider should bear.
本発明は、このような問題を解決し、コストの増加を最小限に抑えつつ、より多くの電子メールを格納領域に保管するため、メールサーバで登録した個人用メール格納領域に電子メールをメタデータに基づいて蓄積するものである。したがって、本発明によるメールサーバは、電子メールを受けた際にその電子メールのデータをそれまでに蓄積したメールデータと比較し、同一内容のデータを検出した際にはその同一内容データ部分を破棄し、その破棄データの格納領域に検出された前記同一内容データの保管場所を参照データとして記録蓄積することを特徴とする。 The present invention solves such a problem and minimizes the increase in cost while keeping more e-mails in the storage area, so that the e-mail is stored in the personal mail storage area registered in the mail server. Accumulate based on data. Therefore, the mail server according to the present invention compares the data of the e-mail with the mail data accumulated so far when receiving the e-mail, and discards the same content data portion when the same content data is detected. The storage location of the same content data detected in the storage area for the discarded data is recorded and accumulated as reference data.
本発明の電子メールの蓄積方法およびそのシステムは、メールサーバが、電子メールを受付けした際にその電子メールのデータをそれまでに蓄積したメールデータと比較し、同一内容のデータを検出した際にはその同一データ部分を破棄している。そのため、上記個人用メール格納領域に同一の内容のデータが既に存在しない場合に限り実体データをその個人用メール格納領域に保管し、利用者ごとには実体データを指示するための参照とメタデータのみを保管することができるので、電子メールを保管するための格納領域容量を従来よりも削減することができる。 The e-mail storage method and system according to the present invention, when the mail server receives the e-mail, compares the e-mail data with the e-mail data accumulated so far, and detects the same content data. Discards the same data part. Therefore, the entity data is stored in the personal mail storage area only when the same content data does not already exist in the personal mail storage area, and the reference and metadata for instructing the entity data for each user. Therefore, the storage area capacity for storing the e-mail can be reduced as compared with the conventional case.
すなわち、従来と同じ容量の格納領域を使用して、より多くの電子メールを格納領域に保管することができる一方、従来よりも小さな容量の格納領域を使用して、従来と同じ分量の電子メールを格納領域に保管することができる。 In other words, while using a storage area with the same capacity as before, more e-mails can be stored in the storage area, while using a storage area with a smaller capacity than before, e-mail with the same amount as before Can be stored in the storage area.
従来と同じ容量の格納領域を使用して、より多くの電子メールを格納領域に保管することができるという目的を、メールサーバが、電子メールを受付けした際にその電子メールのデータをそれまでに蓄積したメールデータと比較し、同一内容のデータ部分を破棄してそれまでに存在しない実体データのみをその格納領域に保管することにより、従来の個人用メール格納領域を損なわずに実現した。破棄した部分には、メタデータに対応する領域に実体データを指示するための参照データが保管される。この比較対象のメールデータは、その利用者の個人用メール格納領域に限定してよい。すなわち、利用者当人以外では、比較対象のデータ量が膨大であることと、参照先を指示するデータが自分以外の意思で廃棄されるためである。 The purpose of storing more e-mails in the storage area using the same storage area as before is to store the e-mail data before the e-mail server accepts the e-mail. Compared with the stored mail data, the data portion having the same contents is discarded, and only the actual data that has not existed so far is stored in the storage area, thereby realizing the conventional personal mail storage area without damaging it. In the discarded portion, reference data for instructing entity data is stored in an area corresponding to the metadata. This comparison target mail data may be limited to the personal mail storage area of the user. That is, the data other than the user himself / herself has an enormous amount of data to be compared, and the data indicating the reference destination is discarded by the intention other than himself / herself.
以下に、図面を参照して実施例について説明する。説明は実施例であり、本発明の主旨とする特許請求の範囲の記載される機能を満たす限り、機能ブロックの分離併合、手順の前後入替えなどの変更は自由であり、下記説明が本発明を限定するものではない。 Embodiments will be described below with reference to the drawings. The description is an example, and as long as the functions described in the scope of claims of the present invention are satisfied, changes such as separation and consolidation of function blocks and replacement of the procedure before and after can be freely performed. It is not limited.
本発明の実施例1について図2および図3に図1を併せ参照して説明する。 A first embodiment of the present invention will be described with reference to FIGS. 2 and 3 together with FIG.
図1の「電子メール」本文については、既に説明済みであるが、再度後に説明する。この実施例では、返信の際に受信本文の全文を引用しているものとする。 Although the “electronic mail” text in FIG. 1 has already been described, it will be described again later. In this embodiment, it is assumed that the entire text of the received text is quoted when replying.
図2は、本発明によるメールサーバの一実施例をブロックで示す構成図である。図2には、メール受付部1、メール分解部2、レベル解析部3、受付データ格納部4、受付データ比較部5、参照データ生成部6、および個人用メール格納領域10が示される。個人用メール格納領域10は、個人用メールデータの格納領域として各個人に設けられ、一般にメタデータ対応で複数の領域を有する。すなわち、各個人用メール格納領域10は、メタデータ(格納領域)11、本文(格納領域)12、および添付ファイル(格納領域)13の領域が階層的に設けられており、本文(格納領域)12には、引用レベル0〜2に対して引用レベル0(格納領域)120から引用レベル2(格納領域)122までのそれぞれが示され、添付ファイル(格納領域)13には、ファイル1およびファイル2に対してファイル1(格納領域)131およびファイル2(格納領域)132のそれぞれが示されている。複数の個人用メール格納領域には、送受信両方のメールデータがメタデータ対応により識別可能に格納蓄積されているものとする。
FIG. 2 is a block diagram showing an embodiment of a mail server according to the present invention in blocks. FIG. 2 shows a
本実施例では、図2のメールサーバが図1に示される電子メール(以後、eメールと呼称する。)をネットワークから受付けしたものとする。 In this embodiment, it is assumed that the mail server in FIG. 2 accepts the electronic mail (hereinafter referred to as e-mail) shown in FIG. 1 from the network.
まず、図1の「eメール」本文について説明する。 First, the “e-mail” text in FIG. 1 will be described.
図示されるeメールは「引用レベル0」を本文としており、「引用レベル1」および「引用レベル2」の部分を本文とする別のeメールに対する返信である。更に、「引用レベル1」および「引用レベル2」の部分は「引用レベル2」の部分を本文とするeメールに対する返信である。図示されるように、引用部分の行頭にはなんらかの記号または余白、この例では「>(不等号)」が付加されている。これは引用記号と呼ばれるもので、引用部分とeメールの差出人が書いた部分とを区別するため付加されている。行頭の引用記号は引用回数、すなわち引用レベルに応じて数が増える。つまり行頭の引用記号の数によって全文引用部分をブロック分けし、各ブロックの引用レベルを判定することができる。図示されるeメールの例では、本文は「引用レベル0」「引用レベル1」「引用レベル2」の3つのブロックに分解される。
The illustrated e-mail is a reply to another e-mail having “
次に、図2の各構成要素について説明する。 Next, each component in FIG. 2 will be described.
メール受付部1はネットワークを介してeメールを受付けする。メール分解部2は、メール受付部1で受付けしたeメールを受け、メタデータ、本文、および添付ファイルに分解し、メタデータは、個人用メール格納領域10のメタデータ11領域に格納する。本文は、レベル解析部3に送られ、添付ファイルは受付データ格納部4に送られる。レベル解析部3は、メール分解部2で分解された本文を受け、図1に示されるように、引用レベルに解析分解される。
The
受付データ格納部4は、まず、レベル解析部3で引用レベルに従って分解された本文の引用レベルごとのデータと、メール分解部2で分解された添付ファイルとを受付けして一時保管すると共に、受付データ比較部5に送る。添付ファイルのない場合もある。また、受付データ格納部4は、受付データ比較部5から比較結果として同一データのため破棄したデータに対する参照データを受け取るので、一致していない実体データと破棄された部分の参照データとを個人用メール格納領域10で最初に記録したメタデータ格納領域に追加して格納蓄積する。
The reception
受付データ比較部5は、受けた本文および添付ファイルを該当する個人用メール格納領域10の領域でデータ比較し、同一内容のデータで破棄する部分とこのデータの実体データが保管される領域を指示する場所データとを参照データ生成部6に送り、参照データの返送を受付けする。参照データ生成部6は、受付データ比較部5から受けたデータから、破棄部分のデータを格納領域での場所データから取り出せるように参照データを形成して受付データ比較部5に返送する。参照とは、例えば各実体データに重複なく付与された番号など、格納領域に保管されたある実体データを一意に指し示すための情報を意味する。
The received
メタデータ(格納領域)11は、メール分解部2で分解されたeメールごとのメタデータ部分を実体データとして受付けして格納する。本文(格納領域)12は、受付データ格納部4から受けた本文の分解データを引用レベルごとに実体データ、そして参照データがある場合にはその参照データを格納する。
The metadata (storage area) 11 accepts and stores the metadata part for each e-mail decomposed by the
すなわち、本文(格納領域)12は、引用レベル0(格納領域)120、引用レベル1(格納領域)121、引用レベル2(格納領域)122の各部に分けられ、引用レベル1(格納領域)121および引用レベル2(格納領域)122では、通常、各引用レベルの文面に対応する実体データへの参照データが格納される。各参照データは参照データ生成部6によって生成され、取得したものである。図1には引用レベル2までしか例示されていないが、本文(格納領域)12が内部にいくつの引用レベルまでの領域を有するかは、対応するeメールが全文引用をいくつのレベルまで行っていたかによる。
That is, the text (storage area) 12 is divided into citation level 0 (storage area) 120, citation level 1 (storage area) 121, and citation level 2 (storage area) 122, and citation level 1 (storage area) 121. In the citation level 2 (storage area) 122, reference data to entity data corresponding to the text of each citation level is normally stored. Each reference data is generated and acquired by the reference
また、添付ファイル(格納領域)13は、受付データ格納部4から受けた添付ファイルまたはその参照データを格納する。添付ファイル(格納領域)13の内部は、ファイル1(格納領域)131およびファイル2(格納領域)132に分かれている。これらには、添付ファイル(格納領域)13に格納されており各添付ファイルに対応する実体データへの参照データが格納される。各参照データは参照データ生成部6によって生成され、取得したものである。図1にはファイル2までしか例示されていないが、添付ファイル格納領域が内部にいくつのファイル用格納領域を有するかは、対応するeメールにファイルがいくつ添付されていたかによる。
The attached file (storage area) 13 stores the attached file received from the received
その結果、それまでに存在しない実体データおよび参照データがその格納領域に保管される。すなわち、受信したeメールから抽出した文面は本文(格納領域)12に、添付ファイルデータは添付ファイル(格納領域)13に、いずれも実体データが保管されたことになる。 As a result, entity data and reference data that do not exist so far are stored in the storage area. That is, the body data is stored in the body (storage area) 12 for the text extracted from the received e-mail and the attachment file (storage area) 13 for the attached file data.
次に、図3のフローチャートに図1および図2を併せ参照して本発明によるメールサーバの主要手順について説明する。すなわち、Webメールサービスを提供するメールサーバが、ある利用者宛てのeメールを受信した際の格納処理について説明する。上述したように、個人用メール格納領域10はその利用者に対する一つのメールに対応する格納領域である。
Next, the main procedure of the mail server according to the present invention will be described with reference to FIGS. 1 and 2 together with the flowchart of FIG. That is, a storage process when a mail server providing a web mail service receives an e-mail addressed to a certain user will be described. As described above, the personal
まず、メール受付部1は、eメールを受付け(手順S1)の際、そのeメールをメール分解部2に送る。メール分解部2は、eメールを「メタデータ・本文・添付ファイル」の三つの部分に分解(手順S2)する。メタデータとは、送り主、日付等といった、eメールの本文以外の部分に付加され、例え内容が同一のeメールであっても各eメールに保管が必要なデータである。通常メタデータの大きさは、eメールの本文および添付ファイルに比べはるかに小さい。従って、個人用メール格納領域10はその利用者に対する一つのメールに対応する格納領域となる。
First, the
次いで、メール分解部2は、分解した「メタデータ」を個人用メール格納領域10のメタデータ(格納領域)11に格納保管(手順S3)すると共に、本文をレベル解析部3、また、添付ファイルがある場合には、添付ファイルを受付データ格納部4へ、それぞれ送る。図1に示されるeメールは全文引用である。全文引用とは、そのeメールが返信を行う元となったeメールの全文を文末に残したものである。これはやり取りの履歴を残す目的で日常的に行われている。その場合、レベル解析部3は、分解された本文部分について解析を行い、全文引用のブロックを引用レベルごとに分解(手順S4)する。
Next, the
なお、引用記号は「>」の他にも「パイプ」など、また「スペース」が使用されることもある。しかし、まず行頭に特別の記号が付けられていないブロックを引用レベル「0」として抽出し、その後全体の引用レベルを下げる、すなわち引用レベル「0」の部分を消去して、各行頭から記号を一文字除去する、という操作を再帰的に行えば、引用記号が何であろうと引用レベルごとにブロックを抽出することが容易に可能である。 In addition to “>”, “pipe” or “space” may be used as the quotation mark. However, first, a block without a special symbol at the beginning of a line is extracted as a citation level “0”, and then the entire citation level is lowered, that is, the part of the citation level “0” is deleted, and a symbol is extracted from the beginning of each line. If the operation of removing one character is performed recursively, it is possible to easily extract a block for each citation level regardless of the citation symbol.
次いで、レベル解析部3で引用レベルごとに分解された文面はそれぞれ受付データ格納部4を介して受付データ比較部5に送られ、今回のめたデータが格納された個人用メール格納領域10以外のメール格納領域の本文格納領域に既に保管されている文面と比較される。ここで、受信したeメールから抽出された文面と同一の文面がメール格納領域の本文格納領域に格納なし(手順S5がNO)の場合、受信したeメールから抽出された文面は、実体データとして新たに本文(格納領域)12に格納保管(手順S6)される。
Next, the text decomposed for each citation level in the
他方、上記手順S5が「YES」で同一の文面がメール格納領域の本文格納領域に格納ありの場合には、受信したeメールから抽出した文面の実体データを保持しておく必要はない。従って、受信したeメールから抽出したデータは破棄(手順S7)され、破棄されたデータと同一データの格納先を参照データに形成取得(手順S8)する。すなわち、受付データ比較部5は破棄されるデータとその実体データ格納先とのデータとを参照データ生成部6に送り、参照データ生成部6で生成された参照データを受けて受付データ比較部5へ送る。
On the other hand, when the above step S5 is “YES” and the same text is stored in the text storage area of the mail storage area, it is not necessary to retain the actual data of the text extracted from the received e-mail. Therefore, the data extracted from the received e-mail is discarded (step S7), and the storage destination of the same data as the discarded data is formed and acquired as reference data (step S8). That is, the received
次いで、受付データ比較部5は、上記手順S6で取得の受付データにおける実体データと手順S8で取得の破棄データに対応の参照データとを、本メールのメタデータ(格納領域)11に対応の領域に格納蓄積して保管(手順S9)する。
Next, the received
上述したように、例えば、図1のeメールの場合には「引用レベル0」の本文のみ実体データとして格納されるが、「引用レベル1」および「引用レベル2」それぞれの部分は他の個人用メール格納領域の同一データが格納される「引用レベル0」の格納領域を参照先として指示する参照データのみが格納される。通常、参照データは引用する本文データと比較して少量なので、eメール全体を保管する従来の方法よりも格納領域容量の消費をはるかに小さく抑えることができる。
As described above, for example, in the case of the email of FIG. 1, only the text of “
また、受けたメールに添付ファイルが含まれる場合、メール分解部2で分解された「添付ファイル」部分は受付データ格納部4を介して受付データ比較部5に送られ、本文の引用レベル同様に、上記手順S5から手順S9までの手順が実行される。従って、添付ファイル格納領域で同一データがある場合も、本文同様、大幅な格納領域の節約が実現できる。
When the received mail includes an attached file, the “attached file” portion decomposed by the
このシステムを用いて利用者宛てのメールを閲覧できるサービスでは、利用者から個人用メール格納領域10が指定された場合、実体データはそのまま出力され、参照データの格納領域ではその参照データから格納先を取得し、そこから実体データを取り出して利用者に出力する。すなわち、利用者が自分宛てのあるeメールを閲覧しようとする際には、その利用者用の個人用メール格納領域10に保管されている、閲覧しようとしているeメールに対応するメタデータと各参照のデータ組を元に、メタデータはそのまま、各参照データは対応する実体データを検索しこれらを組み合わせて再構成できる。従って、Webインタフェースを通じて全てのeメールを利用者に表示することができる。
In a service in which mail addressed to a user can be browsed using this system, when the personal
以上説明したように本発明によれば、同一文面のeメールを複数受信した場合、または同一の添付ファイルが添付されたeメールを複数受信した場合、または以前受信したeメールが全文引用されているeメールを受信した場合に、eメール全体を保管する従来の方法よりも格納領域容量の消費をはるかに小さく抑えることができる。そのためWebメールサーバの格納領域は、従来の方法を用いた場合よりも小さな容量のものを使用できる。または、従来と同じ容量の格納領域を使用すれば、利用者は従来よりも多くのeメールを保管できることになり、従来よりも質の高いサービスを利用者に提供できることになる。すなわち、本発明によれば、従来と同じ利便性をより低コストで利用者に提供することができると共に、従来よりも高い利便性を、従来と同じコストで利用者に提供することができるというものである。 As described above, according to the present invention, when a plurality of e-mails with the same sentence are received, or when a plurality of e-mails with the same attached file are received, or a previously received e-mail is quoted in full text. When the received e-mail is received, the consumption of the storage area capacity can be suppressed much smaller than the conventional method of storing the entire e-mail. For this reason, the storage area of the Web mail server can be used with a smaller capacity than when the conventional method is used. Alternatively, if a storage area having the same capacity as the conventional one is used, the user can store more e-mails than before, and can provide the user with a higher quality service than before. That is, according to the present invention, it is possible to provide the same convenience to the user at a lower cost and to provide the user with a higher convenience than the conventional cost at the same cost as the conventional one. Is.
上記説明では、破棄して参照データとする文面データを同一文面としたが、画像による添付ファイルでは同一画像が同一データとなる。 In the above description, the text data that is discarded and used as reference data is the same text, but the same image is the same data in the attached file of the image.
本発明の実施例2について図2を参照して説明する。上記実施例との相違は、受付データ比較部5に同一判定だけでなく、類似を同一内容と判定可能にすることである。
A second embodiment of the present invention will be described with reference to FIG. The difference from the above embodiment is that not only the reception
上記説明では、破棄して参照データとする文面データを同一文面としたが、類似の文面の場合もある。すなわち、返信の際に、通常、引用レベル0の本文で趣旨の伝達が可能であり、例えば、返信者が受信メールの本文を引用する際に引用レベル1,2において実体データから抜粋する場合がある。従って、文面を比較しても完全には一致しない場合があり、参照データの作成できないものがある。この場合には、所定の基準を設けて類似の文面を参照することができる。すなわち、文書では要約するソフトウェアにより類似を判断させることができる。
In the above description, the text data to be discarded and used as reference data is the same text, but there may be similar texts. That is, when replying, it is usually possible to communicate the meaning with the text of
更に、画像もその差異が小さい場合、データの同一性を計測し、類似と判定し類似のマークを挿入して参照することが可能である。これにより、更に格納領域を削減することができる。このような場合、類似の程度を例えば80%以上、90%以上などとレベル化することもできる。 Further, when the difference between the images is small, it is possible to measure the identity of the data, determine that the images are similar, and insert a similar mark for reference. Thereby, the storage area can be further reduced. In such a case, the degree of similarity can be leveled to, for example, 80% or more, 90% or more, and the like.
メールサーバが受付けのメールをそれまで格納したメールデータと比較し、同一の部分を検出した際に、同一データを破棄すると共に、その格納場所を含む参照データをその破棄した部分に格納することによって、メールデータの格納領域の節減を図ることができるので、メールに限定することなく、同一データの格納が想定されるデータ格納システムに広く適用することができる。 The mail server compares the received mail with the mail data stored so far, and when the same part is detected, the same data is discarded and the reference data including the storage location is stored in the discarded part. Since the storage area of the mail data can be saved, the present invention can be widely applied to data storage systems that are assumed to store the same data without being limited to mail.
1 メール受付部
2 メール分解部
3 レベル解析部
4 受付データ格納部
5 受付データ比較部
6 参照データ生成部
10 個人用メール格納領域
11 メタデータ(格納領域)
12 本文(格納領域)
13 添付ファイル(格納領域)
120 引用レベル0(格納領域)
121 引用レベル1(格納領域)
122 引用レベル2(格納領域)
131 ファイル1(格納領域)
132 ファイル2(格納領域)
DESCRIPTION OF
12 Text (Storage area)
13 Attached files (storage area)
120 Citation level 0 (storage area)
121 Citation level 1 (storage area)
122 Citation level 2 (storage area)
131 File 1 (storage area)
132 File 2 (storage area)
Claims (12)
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008165307A JP2010010859A (en) | 2008-06-25 | 2008-06-25 | Storage method of e-mail, and system therefor |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2008165307A JP2010010859A (en) | 2008-06-25 | 2008-06-25 | Storage method of e-mail, and system therefor |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JP2010010859A true JP2010010859A (en) | 2010-01-14 |
Family
ID=41590865
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2008165307A Withdrawn JP2010010859A (en) | 2008-06-25 | 2008-06-25 | Storage method of e-mail, and system therefor |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JP2010010859A (en) |
Cited By (4)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012249101A (en) * | 2011-05-27 | 2012-12-13 | Hde Inc | Program |
| JP2013004103A (en) * | 2011-06-17 | 2013-01-07 | Nhn Corp | Mail management method and mail management device using chunk |
| JP2016018265A (en) * | 2014-07-04 | 2016-02-01 | キヤノン株式会社 | Information processing system, information processing method, and program |
| JP2021056689A (en) * | 2019-09-30 | 2021-04-08 | サクサ株式会社 | E-mail monitoring device and e-mail management method |
-
2008
- 2008-06-25 JP JP2008165307A patent/JP2010010859A/en not_active Withdrawn
Cited By (5)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2012249101A (en) * | 2011-05-27 | 2012-12-13 | Hde Inc | Program |
| JP2013004103A (en) * | 2011-06-17 | 2013-01-07 | Nhn Corp | Mail management method and mail management device using chunk |
| JP2016018265A (en) * | 2014-07-04 | 2016-02-01 | キヤノン株式会社 | Information processing system, information processing method, and program |
| JP2021056689A (en) * | 2019-09-30 | 2021-04-08 | サクサ株式会社 | E-mail monitoring device and e-mail management method |
| JP7415219B2 (en) | 2019-09-30 | 2024-01-17 | サクサ株式会社 | E-mail monitoring device and e-mail management method |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8429178B2 (en) | Reliability of duplicate document detection algorithms | |
| US9807093B2 (en) | Methods and systems for remotely removing metadata from electronic documents | |
| US7506031B2 (en) | Filtering email messages corresponding to undesirable domains | |
| US6549957B1 (en) | Apparatus for preventing automatic generation of a chain reaction of messages if a prior extracted message is similar to current processed message | |
| US9298710B2 (en) | Document search system which reflects the situation of using documents in the search results | |
| US7624274B1 (en) | Decreasing the fragility of duplicate document detecting algorithms | |
| CN101079827B (en) | Email management method and system | |
| US7925706B2 (en) | Filtering electronic messages | |
| CN101667976B (en) | Mail pushing mode determining method, pushing method and pushing device | |
| CN104182549A (en) | E-mail digest generation method and device | |
| JP2010010859A (en) | Storage method of e-mail, and system therefor | |
| JP2004240945A (en) | Automatic spam mail blocking method via dynamic URL connection | |
| JP3130332B2 (en) | Fax transmission method and its device | |
| US10956872B2 (en) | Message handling | |
| JP2005284454A (en) | Junk e-mail distribution preventive system, and information terminal and e-mail server in the system | |
| CN102223318A (en) | Method and system for processing emails | |
| KR100504441B1 (en) | Method and system for providing permanent mail service | |
| US20070185970A1 (en) | Method, system, and computer program product for providing messaging services | |
| JPH0991302A (en) | E-mail database system | |
| KR20060131431A (en) | Network device and method for preventing leakage of confidential information | |
| JP2003188921A (en) | Email transfer device | |
| JP2002056001A (en) | Savvy person extraction device and computer readable recording medium recording savvy person extraction program | |
| JP2009301186A (en) | Program | |
| KR20050061261A (en) | An electronic mail system with a function that splitting attached file | |
| JP2007233468A (en) | Information processing apparatus and information processing method |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20110906 |