JP2005182400A - Natural language processor, processing method and program, and portable terminal loaded with natural language processor - Google Patents
Natural language processor, processing method and program, and portable terminal loaded with natural language processor Download PDFInfo
- Publication number
- JP2005182400A JP2005182400A JP2003421294A JP2003421294A JP2005182400A JP 2005182400 A JP2005182400 A JP 2005182400A JP 2003421294 A JP2003421294 A JP 2003421294A JP 2003421294 A JP2003421294 A JP 2003421294A JP 2005182400 A JP2005182400 A JP 2005182400A
- Authority
- JP
- Japan
- Prior art keywords
- partner information
- analysis
- information
- partner
- natural language
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title abstract 2
- 238000004458 analytical method Methods 0.000 claims abstract description 242
- 238000000605 extraction Methods 0.000 claims abstract description 55
- 238000003058 natural language processing Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 43
- 230000000877 morphologic effect Effects 0.000 claims description 43
- 239000000284 extract Substances 0.000 claims description 22
- 238000007726 management method Methods 0.000 description 19
- 241001385733 Aesculus indica Species 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000002245 particle Substances 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 2
- 241000277269 Oncorhynchus masou Species 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
Images
Landscapes
- Information Transfer Between Computers (AREA)
- Machine Translation (AREA)
- Document Processing Apparatus (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
Description
本発明は自然言語処理装置、方法、及びプログラム、並びに自然言語処理装置を搭載した携帯端末に関し、特に、電子メールをやりとりしている相手の情報(属性や状況など)を電子メールから自動的に抽出してデータベースとして蓄積することを可能とする、自然言語処理装置、方法、及びプログラム、並びに自然言語処理装置を搭載した携帯端末に関する。 The present invention relates to a natural language processing apparatus, method and program, and a portable terminal equipped with a natural language processing apparatus, and in particular, information (attributes, status, etc.) of a partner with whom an electronic mail is exchanged is automatically transmitted from the electronic mail. The present invention relates to a natural language processing apparatus, method, and program that can be extracted and stored as a database, and a portable terminal equipped with the natural language processing apparatus.
近年、パーソナルコンピュータや携帯端末を利用した電子メールが広く普及してきたため、電子メールをやりとりしている相手の情報(属性や状況など)を容易に得られるユーザインタフェースの提供が望まれるようになってきている。 In recent years, e-mail using personal computers and portable terminals has become widespread, and it has become desirable to provide a user interface that can easily obtain information (attributes, status, etc.) of the partner with whom e-mail is exchanged. ing.
しかしながら、電子メールをやりとりしている相手の情報を、その電子メールを元に得ようとする場合、まずは膨大な量の過去の電子メールを保存しておくことが前提となり、更には、それら過去の電子メールから必要な情報を一つずつ検索して確認するという作業が必要である。 However, in order to obtain information on the other party with whom an email is exchanged based on the email, it is premised that a huge amount of past emails must be saved, It is necessary to search and confirm necessary information one by one from the e-mail.
電子メールには、その送受信者間或いは関係者間にとって有用な情報が多く含まれているが、その有用な情報を電子メールを元にして得ようとする場合には、上述したように、膨大な量の過去の電子メールを保存しておくことが前提となり、それら過去の電子メールから、得ようとする有用な情報を一つずつ検索して確認するといった作業が必要となってくる。 The e-mail contains a lot of useful information for the sender / receiver or between the parties concerned. However, when trying to obtain the useful information based on the e-mail, as described above, it is enormous. It is assumed that a large amount of past e-mails is stored, and it is necessary to search and confirm useful information to be obtained one by one from the past e-mails.
膨大な量の電子メールを、後に効率的に確認できるようにするために、これら電子メールをテーマ別にデータベース化して保存・蓄積しておくことが一つの解決策として提案されてきている(例えば、特許文献1参照。)。 In order to be able to efficiently check a large amount of e-mails later, it has been proposed as a solution to store and store these e-mails in a database by theme (for example, (See Patent Document 1).
上述した特許文献1に記載の「情報管理装置、通信端末、情報管理システム、情報管理方法、記録媒体及びプログラム」には、特定の人物間でやりとりされた業務文書(電子メール)を、業務課題毎にデータベースで別に保管することが記載されており、このことにより、データベースに保管された業務文書を、その業務課題の関係者間で共有することができるようになるとしている。 In the “information management device, communication terminal, information management system, information management method, recording medium, and program” described in Patent Document 1 described above, business documents (e-mail) exchanged between specific persons are It is described that the database is stored separately in each database, and this allows business documents stored in the database to be shared among the parties involved in the business task.
また、電子メールから有用な情報を一つずつ検索して確認するといった作業を、作業負担の増加を招くことなく自動的に行う電子メール装置も提案されている(例えば、特許文献2参照。)。 There has also been proposed an e-mail apparatus that automatically performs an operation of searching and checking useful information one by one from an e-mail without causing an increase in work load (see, for example, Patent Document 2). .
上述した特許文献2に記載の「電子メール装置、及び電子メールプログラムが記録された記録媒体」には、電子メール装置のCPUが、受信した電子メールから所定の部分に記載される文字列を抽出し、この抽出された文字列を、例えば住所録プログラムによって管理されている住所録データ等の分類に応じた所定の項目に登録する技術が記載されている。このことにより、住所録データによって分類して記憶される複数の項目に応じて、受信した電子メールの所定の部分(シグネチャなど)に記載される部分から必要な情報が抽出されて登録されるために、特別な編集作業等を行うことなく電子メールの内容を有効に利用することができるようになるとしている。
In the above-mentioned “recording medium on which an electronic mail apparatus and an electronic mail program are recorded” described in
さらに、電子メールから有用な情報(属性情報)を抽出するにあたり、電子メールのテキストを解析して単語分割や単語情報を取得し、辞書を用いてテキストから属性情報を抽出する電子メールシステムも提案されている(例えば、特許文献3参照。)。 Furthermore, when extracting useful information (attribute information) from e-mails, we also propose an e-mail system that analyzes e-mail texts to obtain word segmentation and word information, and extracts attribute information from texts using a dictionary. (For example, see Patent Document 3).
上述した特許文献3に記載の「電子メールシステム」には、辞書を用いて、メール中のテキストを解析して単語分割や単語情報を取得するテキスト解析処理部と、これを用いてヘッダ部および本文部より属性情報を抽出する属性情報抽出部と、属性情報を電子メールのヘッダ部に拡張情報として追加するヘッダ更新部と、を備える電子メールシステムが記載されている。このシステムにより、電子メールの属性情報を抽出して表示したりできるようになるものとしている。 The “e-mail system” described in Patent Document 3 described above uses a dictionary to analyze a text in an email to obtain word division and word information, and to use this to analyze a header and An e-mail system is described that includes an attribute information extraction unit that extracts attribute information from a body part, and a header update unit that adds the attribute information as extension information to the header part of the e-mail. With this system, it is possible to extract and display e-mail attribute information.
上述した従来の情報管理装置や電子メールシステムにおいては、受信した電子メールをテーマ別にデータベース化して蓄積・保存すること、或いは、受信した電子メールから住所録データ等の有用な情報を抽出して必要箇所に登録して利用すること、また、電子メールのテキストを解析して電子メールの属性情報を抽出すること、などが実現できるようになり、膨大な量の電子メールから有用な情報を自動的に抽出・保存することが可能となっている。 In the above-described conventional information management apparatus and e-mail system, it is necessary to store and store the received e-mail as a database by theme, or to extract useful information such as address book data from the received e-mail. It is possible to register and use in locations, analyze email text and extract email attribute information, etc., and automatically collect useful information from a huge amount of email It is possible to extract and save.
しかし、それらの電子メールから、電子メールをやりとりしている相手の属性や状況などの情報を、自動的に抽出して保存するユーザインタフェースを提供することができれば、従来行われていた、受信した電子メールから必要な情報を手動でピックアップして保存するといった大変な手間が削減されるようになり、ユーザの利便性が向上するものとなる。 However, if it is possible to provide a user interface that automatically extracts and saves information such as the attributes and status of the person with whom the email is exchanged from those emails, it has been received in the past The trouble of manually picking up and storing necessary information from the e-mail is reduced, and the convenience for the user is improved.
また、電子メールのテキスト解析処理が、例えば上述の特許文献3に記載の電子メールシステムより簡便な方式で実現できれば、近年普及してきた携帯端末などの、ハードウェアリソースに制限を持つ小型装置であっても、容易に搭載可能となり、ユーザの利便性がより一層向上するものとなる。 In addition, if e-mail text analysis processing can be realized by a simpler method than the e-mail system described in Patent Document 3, for example, it is a small device with limited hardware resources, such as portable terminals that have become popular in recent years. However, it can be easily mounted, and the convenience for the user is further improved.
本発明は上述した事情を改善するために成されたものであり、従って本発明の目的は、電子メールをやりとりしている相手の情報(属性や状況など)を電子メールから自動的に抽出してデータベースとして蓄積することを可能とし、また、ハードウェアリソースに制限を持つ小型装置であっても容易に搭載可能とすることにより、相手情報を容易にまとまった形で閲覧することを可能とする、自然言語処理装置、方法、及びプログラム、並びに自然言語処理装置を搭載した携帯端末を提供することにある。 The present invention has been made in order to improve the above-described circumstances. Therefore, the object of the present invention is to automatically extract information (attributes, status, etc.) of the partner with whom an email is exchanged from the email. Can be stored as a database, and even small devices with limited hardware resources can be easily installed, so that partner information can be easily viewed in a unified form. Another object of the present invention is to provide a natural language processing apparatus, method and program, and a portable terminal equipped with the natural language processing apparatus.
本発明の自然言語処理装置は、電子メールをやりとりしている相手の属性や状況などからなる相手情報を受信電子メールから抽出して相手情報データベースに登録する自然言語処理装置であって、
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる制御と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる制御と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する制御と、を行う制御部と、
を備えることを特徴とする。
The natural language processing apparatus of the present invention is a natural language processing apparatus that extracts partner information including attributes and conditions of a partner with whom an email is exchanged from a received email and registers it in the partner information database.
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. A dictionary for analysis and relation analysis,
Control for causing the morpheme analysis unit to analyze the email body of the received email, control for causing the relationship analysis unit to perform relationship analysis based on the analysis result of the morpheme analysis unit, and execution of the partner information extraction process, and the relationship analysis A control unit for performing the control of adding the e-mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the unit and registering the information in the counterpart information database;
It is characterized by providing.
また、前記自然言語処理装置は、更に、相手情報を履歴として管理する相手情報履歴管理部を備え、前記制御部は、前記関係解析部の抽出処理の結果を得た際に、前記相手情報履歴管理部に前記抽出処理の結果と同一カテゴリの相手情報が既に前記相手情報データベースに登録されているかを確認させ、同一カテゴリの相手情報が既に登録されていた場合には既存の相手情報を前記抽出処理の結果に置き換えて登録させる制御を行わせる、ことを特徴とする。 The natural language processing device further includes a partner information history management unit that manages partner information as a history, and the control unit obtains the result of the extraction process of the relation analysis unit, and the partner information history The management unit confirms whether the partner information of the same category as the result of the extraction process has already been registered in the partner information database. If the partner information of the same category has already been registered, the existing partner information is extracted. It is characterized in that control is performed to replace the result of processing for registration.
さらに、前記自然言語処理装置は、入力装置から相手情報の閲覧要求情報を得た際に、前記相手情報データベースを検索して前記閲覧要求情報に合致する相手情報を抽出し出力装置に出力する、ことを特徴とする。 Further, when the natural language processing device obtains the browsing request information of the partner information from the input device, it searches the partner information database, extracts the partner information that matches the browsing request information, and outputs it to the output device. It is characterized by that.
本発明の自然言語処理方法は、電子メールをやりとりしている相手の属性や状況などからなる相手情報を受信電子メールから抽出して相手情報データベースに登録する自然言語処理装置において、
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、を備え、
前記自然言語処理装置が、受信電子メールの電子メール本文を前記形態素解析部に形態素解析させるステップと、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させるステップと、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録するステップと、を実行することを特徴とする。
The natural language processing method of the present invention is a natural language processing apparatus that extracts partner information including attributes and conditions of a partner with whom an email is exchanged from a received email and registers it in the partner information database.
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. And a dictionary for analysis and relation analysis,
The natural language processing device causes the morphological analysis unit to analyze the email body of the received e-mail, and causes the relationship analysis unit to analyze the relationship from the analysis result of the morpheme analysis unit, and executes partner information extraction processing And a step of adding a mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the relation analysis unit and registering the result in the partner information database. Features.
また、前記自然言語処理装置は、更に、相手情報を履歴として管理する相手情報履歴管理部を備え、前記自然言語処理装置が、前記関係解析部の抽出処理の結果を得た際に、前記相手情報履歴管理部に前記抽出処理の結果と同一カテゴリの相手情報が既に前記相手情報データベースに登録されているかを確認させ、同一カテゴリの相手情報が既に登録されていた場合には既存の相手情報を前記抽出処理の結果に置き換えて登録させる、ことを特徴とする。 The natural language processing device further includes a partner information history management unit that manages partner information as a history, and when the natural language processing device obtains a result of the extraction process of the relation analysis unit, Let the information history management unit check whether the partner information of the same category as the result of the extraction process has already been registered in the partner information database, and if the partner information of the same category has already been registered, the existing partner information is The result of registration is replaced with the result of the extraction process.
さらに、前記自然言語処理装置は、入力装置から相手情報の閲覧要求情報を得た際に、前記相手情報データベースを検索して前記閲覧要求情報に合致する相手情報を抽出し出力装置に出力するステップを実行する、ことを特徴とする。 Further, when the natural language processing device obtains the browsing request information of the partner information from the input device, the natural language processing device searches the partner information database, extracts the partner information that matches the browsing request information, and outputs the partner information to the output device. It is characterized by performing.
本発明のプログラムは、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に電子メールをやりとりしている相手の属性や状況などからなる相手情報を抽出する処理を行う関係解析部と、
相手情報として相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、を備え、受信電子メールから相手情報を抽出して前記相手情報データベースに登録する自然言語処理装置のコンピュータに、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる処理と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる処理と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する処理と、を実行させることを特徴とする。
The program of the present invention includes a morpheme analyzer that performs a process of dividing a sentence included in a received e-mail into word units;
A relational analysis unit that performs processing to extract partner information consisting of attributes and status of a partner who is exchanging e-mails based on the analysis result of the morphological analysis unit;
Morphological analysis that is stored in the partner information database as partner information and stores the minimum necessary words and relation analysis rules, and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing A relational analysis dictionary, and a computer of a natural language processing device that extracts partner information from received e-mail and registers it in the partner information database;
A process for causing the morphological analysis unit to analyze the body of the email of the received e-mail, a process for causing the relational analysis unit to perform a relational analysis based on an analysis result of the morpheme analysis part, and a process for executing the partner information extraction process. A process of adding the mail address and time stamp information of the e-mail header information of the received e-mail to the result of the part extraction process and registering the result in the partner information database.
また、前記自然言語処理装置は、更に、相手情報を履歴として管理する相手情報履歴管理部を備え、前記プログラムは、前記コンピュータが前記関係解析部から抽出処理の結果を得た際に、前記相手情報履歴管理部に前記抽出処理の結果と同一カテゴリの相手情報が既に前記相手情報データベースに登録されているかを確認させ、同一カテゴリの相手情報が既に登録されていた場合には既存の相手情報を前記抽出処理の結果に置き換えて登録させる処理を実行させる、ことを特徴とする。 The natural language processing apparatus further includes a partner information history management unit that manages partner information as a history, and the program receives the result of the extraction process from the relation analysis unit when the computer obtains a result of the extraction process. Let the information history management unit check whether the partner information of the same category as the result of the extraction process has already been registered in the partner information database, and if the partner information of the same category has already been registered, the existing partner information is It is characterized in that a process of registering with the result of the extraction process is executed.
さらに、前記プログラムは、入力装置から相手情報の閲覧要求情報を得た際に、前記相手情報データベースを検索して前記閲覧要求情報に合致する相手情報を抽出し出力装置に出力する処理を実行させる、ことを特徴とする。 Further, when the program obtains the browsing request information of the partner information from the input device, the program executes a process of searching the partner information database to extract partner information that matches the browsing request information and outputting it to the output device. It is characterized by that.
本発明の自然言語処理装置を搭載した携帯端末は、電子メールをやりとりしている相手の属性や状況などからなる相手情報を受信電子メールから抽出して相手情報データベースに登録する自然言語処理装置を搭載した携帯端末であって、
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる制御と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる制御と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する制御と、を行う制御部と、
を備えることを特徴とする。
A mobile terminal equipped with the natural language processing device of the present invention is a natural language processing device that extracts partner information including attributes and conditions of a partner with whom an email is exchanged from a received email and registers it in the partner information database. An on-board mobile device,
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. A dictionary for analysis and relation analysis,
Control for causing the morpheme analysis unit to analyze the email body of the received email, control for causing the relationship analysis unit to perform relationship analysis based on the analysis result of the morpheme analysis unit, and execution of the partner information extraction process, and the relationship analysis A control unit for performing the control of adding the e-mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the unit and registering the information in the counterpart information database;
It is characterized by providing.
また、前記自然言語処理装置は、更に、相手情報を履歴として管理する相手情報履歴管理部を備え、前記制御部は、前記関係解析部の抽出処理の結果を得た際に、前記相手情報履歴管理部に前記抽出処理の結果と同一カテゴリの相手情報が既に前記相手情報データベースに登録されているかを確認させ、同一カテゴリの相手情報が既に登録されていた場合には既存の相手情報を前記抽出処理の結果に置き換えて登録させる制御を行わせる、ことを特徴とする。 The natural language processing device further includes a partner information history management unit that manages partner information as a history, and the control unit obtains the result of the extraction process of the relation analysis unit, and the partner information history The management unit confirms whether the partner information of the same category as the result of the extraction process has already been registered in the partner information database. If the partner information of the same category has already been registered, the existing partner information is extracted. It is characterized in that control is performed to replace the result of processing for registration.
さらに、前記自然言語処理装置は、入力装置から相手情報の閲覧要求情報を得た際に、前記相手情報データベースを検索して前記閲覧要求情報に合致する相手情報を抽出し出力装置に出力する、ことを特徴とする。 Further, when the natural language processing device obtains the browsing request information of the partner information from the input device, it searches the partner information database, extracts the partner information that matches the browsing request information, and outputs it to the output device. It is characterized by that.
本発明の自然言語処理装置、方法、及びプログラム、並びに自然言語処理装置を搭載した携帯端末は、受信電子メールから相手情報を自動的に抽出し、相手情報を相手情報データベースに蓄積できるので、膨大な量の過去の電子メールを保存およびその検索をすることなしに、相手情報を容易にまとまった形で閲覧することが可能となるという効果を有すると共に、ユーザが手動で受信電子メールから相手情報を抽出する作業が必要なくなり、ユーザの手間を削減可能となり、ユーザの利便性が向上する、という効果を有している。 The natural language processing device, method and program of the present invention, and a portable terminal equipped with the natural language processing device can automatically extract the partner information from the received e-mail and store the partner information in the partner information database. It is possible to easily view the partner information in a collective form without storing and retrieving a large amount of past emails, and the user can manually read the partner information from the received email. This eliminates the need for the work of extracting, so that the user's labor can be reduced and the convenience of the user is improved.
また、本発明において、形態素解析処理に関係解析処理を追加しており、関係解析処理として必要となる程度の形態素解析処理にとどめることにより、そして、形態素解析/関係解析用辞書には、関係解析処理に必要な最低限の単語とそのルールだけを登録することにより、ハードウェアリソースに制限のある携帯端末などの小型装置であっても、自然言語処理装置を容易に搭載可能となると共に、自然言語処理の速度が向上する、という効果を奏することができる。 Further, in the present invention, a relational analysis process is added to the morphological analysis process. By limiting the morphological analysis process to a degree necessary for the relational analysis process, the morphological analysis / relationship analysis dictionary includes a relational analysis. By registering only the minimum words and rules necessary for processing, a natural language processing device can be easily installed even in a small device such as a portable terminal with limited hardware resources. The effect that the speed of language processing improves can be produced.
さらに、本発明において、電子メールが持つタイムスタンプを利用して、相手情報を時系列的に相手情報データベースに登録することにより、相手情報を時系列的に閲覧可能となる、という効果を奏することができる。 Furthermore, in the present invention, by registering the partner information in the partner information database in time series using the time stamp of the e-mail, there is an effect that the partner information can be browsed in time series. Can do.
次に、本発明の実施の形態について図面を参照して説明する。 Next, embodiments of the present invention will be described with reference to the drawings.
図1は、本発明の自然言語処理装置を搭載した携帯端末の一実施形態を示すブロック図である。 FIG. 1 is a block diagram showing an embodiment of a portable terminal equipped with the natural language processing apparatus of the present invention.
図1に示す本実施の形態は、携帯電話機やPHS(Personal Handyphone System:パーソナルハンディホンシステム)端末、或いは、PDA(Personal Digital Assistance:携帯情報端末)などで構成される携帯端末9に、自然言語処理装置を搭載した場合の実施形態を示すものである。携帯端末9は、図示しない電子メール送受信装置を搭載しているものとする。 The present embodiment shown in FIG. 1 is applied to a mobile terminal 9 including a mobile phone, a PHS (Personal Handyphone System) terminal, or a PDA (Personal Digital Assistance). 1 shows an embodiment in which a processing apparatus is mounted. The portable terminal 9 is assumed to be equipped with an electronic mail transmission / reception device (not shown).
図1において、携帯端末9は、キーボードやキー入力装置等の入力装置1と、ディスプレイ装置や印刷装置等の出力装置2と、受信した電子メールから相手情報の抽出処理を行う相手情報抽出処理装置3と、受信した電子メールを蓄積・保存する受信電子メールデータベース4と、相手情報抽出処理装置3が抽出した相手情報が登録される相手情報データベース5と、から構成されている。
In FIG. 1, a portable terminal 9 includes an input device 1 such as a keyboard and a key input device, an
ここで、相手情報とは、電子メールの送信者、つまり相手の属性や状況を示す情報である。そして、相手の属性とは、相手の住所、氏名、年齢、生年月日、職業、電話番号、電子メールアドレスなどの特徴・性質情報であり、相手の状況とは、相手が旅行に行ったとか、うれしいことがあったなど、受信電子メールから知ることができる相手の近況などに関するイベント情報である。 Here, the partner information is information indicating the attribute and status of the sender of the electronic mail, that is, the partner. The other party's attributes are information on characteristics / characteristics such as the other party's address, name, age, date of birth, occupation, telephone number, email address, etc. The situation of the other party means that the other party has traveled This is event information about the recent situation of the other party that can be known from the received e-mail.
相手情報抽出処理装置3は、相手情報抽出処理装置3全体の動作制御を行う制御部31と、制御部31の制御により受信電子メールの形態素解析を行う形態素解析部32と、制御部31の制御により形態素解析部32の解析結果を元に相手情報を解析し抽出する関係解析部33と、形態素解析部32及び関係解析部33が解析を行う際に参照する形態素解析/関係解析用辞書34と、制御部31の制御プログラムを記憶・格納する記憶部35と、から構成されている。
The partner information extraction processing device 3 includes a
制御部31は、CPU(Central Processing Unit:中央処理装置)を備え、記憶部35に格納されている制御プログラムによって動作するよう構成されている。なお、形態素解析部32及び関係解析部33の処理も記憶部35に格納されている制御プログラムによって動作するよう構成してもよい。
The
制御部31は、受信電子メールデータベース4と相手情報データベース5のアクセス制御、形態素解析部32及び関係解析部33の動作制御、入力装置1からの入力情報制御、出力装置2への出力情報制御、を行う。
The
形態素解析部32は、形態素解析/関係解析用辞書34を使用して、受信電子メールに対して形態素解析する処理を行う。形態素解析処理とは、受信電子メールに含まれる文章を単語(形態素)単位に分割する処理である。
The
関係解析部33は、形態素解析部32の解析結果と形態素解析/関係解析用辞書34を使用して、相手に関する属性や近況などの状況、すなわち、相手情報を抽出する処理を行う。関係解析部33で抽出された相手情報は、制御部31を介して相手の属性や状況などのカテゴリに分類され相手情報データベース5に登録される。
The
形態素解析/関係解析用辞書34は、形態素解析部32及び関係解析部33が解析処理を行う際に必要となる単語及び関係解析用ルールを記憶・格納している辞書である。解析処理を行う際に必要となる単語とは、例えば、名詞、動詞、助詞、助動詞、など文章を構成する品詞であり、具体的には、「私」(代名詞)、「は」(副助詞)、「大学生」(名詞)、「に」(格助詞)、「なりました」(本実施形態における簡略化された単語)などの単語である。なお、「なりました」は、通常であれば、「なり」(「なる」:自動詞)、「まし」(「ます」:助動詞・特殊型)、「た」(助動詞・特殊型)と、更に細分化される単語であるが、本実施形態においては単語の簡略化を図るため、「なりました」を一つの単語として使用するようにしている。このことにより、形態素解析/関係解析用辞書34への登録単語数が少なくなり、辞書として必要となるメモリ容量の削減を図るものである。
The morpheme analysis /
また、解析処理を行う際に必要となる関係解析用ルールとは、相手情報を抽出する際の基準を示すものであり、例えば、「xは大学生になりました」という文章からは、「x=大学生」という相手情報を抽出する、というルールである。これは、左辺のxに当てはまる単語(行為者)が「x=大学生」という関係を持つことを表すものである。 Also, the relational analysis rules necessary for performing the analysis process indicate the criteria for extracting the partner information. For example, from the sentence “x has become a college student”, “x The rule is that the partner information “= University student” is extracted. This indicates that a word (actor) that applies to x on the left side has a relationship of “x = university student”.
関係解析用ルールは、また、抽出された相手情報を相手情報データベース5へ登録する際の基準をも示すものであり、例えば、「職業:大学生」というルールは、「大学生」を相手情報データベース5の「職業カテゴリ」として登録する、という基準を示すものである。また、「私:メール送信者」というルールは、行為者が「私」である場合には、相手情報データベース5に登録する、という基準を示すものである。
The relation analysis rule also indicates a standard for registering the extracted partner information in the
次に、図2を参照して、図1に示した本実施形態の動作について説明する。 Next, the operation of the present embodiment shown in FIG. 1 will be described with reference to FIG.
図2は、図1の実施形態の動作を説明するフローチャートである。 FIG. 2 is a flowchart for explaining the operation of the embodiment of FIG.
まず、電子メールの受信をきっかけとして、相手情報抽出処理装置3の制御部31が、受信電子メールデータベース4から受信した電子メールの取り込みを行う(図2のステップA1)。取り込んだ電子メール(電子メールヘッダ情報と電子メール本文とから構成されている)のうち、電子メール本文は形態素解析部32に渡し、メールアドレス、タイムスタンプなどの電子メールヘッダ情報は、相手情報データベース5への登録の際に使用するため、制御部31で保持する。
First, triggered by the reception of the email, the
制御部31は、形態素解析部32を起動し、形態素解析部32では、制御部31から電子メール本文を受け取り、形態素解析/関係解析用辞書34を使用して形態素解析処理を行う(ステップA2)。形態素解析処理とは、前述したように、受信電子メールに含まれる文章を単語(形態素)単位に分割する処理であるが、本実施形態においては、相手情報として登録したい単語が抽出されれば良いため、この後実行される関係解析部33の解析処理に支障をきたさない程度の精度で形態素解析を行う。具体的には、前述したように、「なりました」を一つの単語として扱うようにするなど、である。形態素解析部32で形態素解析された結果は、制御部31に渡される。
The
形態素解析された結果を渡された制御部31は、次に、関係解析部33を起動し、形態素解析された結果を関係解析部33に渡す。関係解析部33では、形態素解析された結果を制御部31から受け取り、形態素解析/関係解析用辞書34を使用して関係解析処理を行い、相手情報の抽出処理を行う(ステップA3)。関係解析処理とは、前述したように、相手に関する属性や近況などの状況を抽出する処理であり、形態素解析/関係解析用辞書34には、相手情報を抽出する上で最低限必要となる単語と、関係解析用ルールとが格納されているため、関係解析部33は、形態素解析された結果と形態素解析/関係解析用辞書34を使用して相手情報を抽出することができる。関係解析部33で関係解析された結果は、制御部31に渡される。
The
制御部31は、関係解析された結果すなわち得られた相手情報を、メールアドレス、タイムスタンプ等の情報を付与して、相手情報データベース5に登録する(ステップA4)。相手情報データベース5へは、相手情報を属性や状況などのカテゴリに分類し、かつ、タイムスタンプを利用して相手情報を時系列的に並べ、データベース内の一レコードとして追加して登録する。
The
以上の処理の後、入力装置1を操作して、相手情報データベース5をアクセスすることにより、制御部31は相手情報データベース5から相手情報を検索して出力装置2に出力する(ステップA5)。このことにより、相手情報をまとまった形で閲覧することが可能となる。
After the above processing, by operating the input device 1 and accessing the
次に、具体例を用いて、図1の実施形態の動作について再度説明する。 Next, the operation of the embodiment of FIG. 1 will be described again using a specific example.
例えば、受信電子メールデータベース4に、「私は大学生になりました!」という電子メール本文を含む電子メールがあるものとする。また、形態素解析/関係解析用辞書34に、「xは大学生になりました」という文章から「x=大学生」という相手情報を抽出するというルールと、「職業:大学生」(「大学生」を相手情報データベース5の「職業カテゴリ」として登録する)というルールと、「私:メール送信者」(行為者が「私」である場合には相手情報データベース5に登録する)というルールと、が記憶・格納されているものとする。
For example, it is assumed that the received e-mail database 4 has an e-mail including an e-mail text “I am a college student!”. Also, in the
まず、相手情報抽出処理装置3の制御部31が電子メールの取り込みを行う(図2のステップA1)。その電子メールに対して形態素解析処理を行う(ステップA2)。電子メール本文が「私は大学生になりました!」の場合は、「私/は/大学生/に/なりました/!」のように単語(形態素)単位に分割される。なお、本実施形態においては、前述したように、「なりました」を一単語として扱うようにしている。
First, the
この形態素解析の結果を使用して、関係解析処理を行う(ステップA3)。「私/は/大学生/に/なりました/!」という形態素解析結果を受けて、まず、「xは大学生になりました」という文章から「x=大学生」という相手情報を抽出するというルールにより、「私=大学生」という情報が抽出される。また、「私:メール送信者」というルールにより、「私=大学生」という情報が相手情報データベース5に登録される対象情報であることがわかる。さらに、「職業:大学生」というルールにより、「大学生」は相手情報データベース5の「職業カテゴリ」として登録されるものであることがわかる。
Using the result of this morphological analysis, a relational analysis process is performed (step A3). Based on the morphological analysis result of “I / ha / university student / ni / now /!”, First, the rule that “x = university student” is extracted from the sentence “x became a college student” Thus, the information “I = University student” is extracted. Further, the rule “I: mail sender” indicates that the information “I = university student” is the target information registered in the
その結果、相手情報データベース5には、メール送信者は大学生(職業カテゴリ)である、という相手情報がタイムスタンプを付して登録される(ステップA4)。
As a result, the partner information that the mail sender is a college student (profession category) is registered in the
以上の処理の後、入力装置1を操作して、相手情報データベース5をアクセスすることにより、今回のメール送信者は大学生である、という情報を出力装置2を通じて閲覧することが可能となる(ステップA5)。
After the above processing, by operating the input device 1 and accessing the
以上説明したように、本実施形態によれば、受信電子メールから相手情報を自動的に抽出し、相手情報を相手情報データベース5に蓄積できるので、膨大な量の過去の電子メールを保存およびその検索をすることなしに、相手情報を容易にまとまった形で閲覧することが可能となるという効果を有すると共に、ユーザが手動で受信電子メールから相手情報を抽出する作業が必要なくなり、ユーザの手間を削減可能となり、ユーザの利便性が向上する、という効果を有している。
As described above, according to the present embodiment, the partner information can be automatically extracted from the received electronic mail, and the partner information can be stored in the
また、本実施形態において、形態素解析処理に関係解析処理を追加しており、関係解析処理として必要となる程度の形態素解析処理にとどめることにより、そして、形態素解析/関係解析用辞書34には、関係解析処理に必要な最低限の単語とそのルールだけを登録することにより、ハードウェアリソースに制限のある携帯端末などの小型装置であっても、自然言語処理装置を容易に搭載可能となると共に、自然言語処理の速度が向上する、という効果を奏することができる。
Further, in the present embodiment, a relational analysis process is added to the morphological analysis process, and the morphological analysis /
さらに、本実施形態において、電子メールが持つタイムスタンプを利用して、相手情報を時系列的に相手情報データベース5に登録することにより、相手情報を時系列的に閲覧可能となる、という効果を奏することができる。
Further, in the present embodiment, by registering the partner information in the
次に、図3、図4を参照して、自然言語処理装置を搭載した携帯端末の第2の実施形態について説明する。 Next, with reference to FIG. 3 and FIG. 4, a second embodiment of the mobile terminal equipped with the natural language processing device will be described.
図3は、本発明の自然言語処理装置を搭載した携帯端末の第2の実施形態を示すブロック図である。 FIG. 3 is a block diagram showing a second embodiment of a portable terminal equipped with the natural language processing apparatus of the present invention.
図3に示す第2の実施形態は、図1に示した第1の実施形態における相手情報データベース5に代えて、相手情報履歴処理装置50を有する点でのみ第1の実施形態と異なるものである。従って、図3において図1に示す構成要素に対応するものは同一の参照数字または符号を付し、その説明を省略するものとする。
The second embodiment shown in FIG. 3 differs from the first embodiment only in that it has a partner information history processing device 50 instead of the
図3において、制御部31に接続される相手情報履歴処理装置50は、相手情報を履歴として管理し保存する機能を備えており、相手情報履歴管理部51と相手情報データベース52とから構成されている。
In FIG. 3, the partner information history processing device 50 connected to the
相手情報履歴管理部51は、相手情報における履歴を管理し、同一カテゴリに属する情報はその最新情報だけを管理し、最新情報だけを相手情報データベース52に登録する。相手情報データベース52は、相手情報が登録されるデータベースである。
The partner information
次に、図4を参照して、図3に示した第2の実施形態の動作について説明する。 Next, the operation of the second embodiment shown in FIG. 3 will be described with reference to FIG.
図4は、図3の第2の実施形態の動作を説明するフローチャートである。図4に示す動作は、図2で示した第1の実施形態の動作に、相手情報履歴管理部51の動作が追加されている点でのみ、第1の実施形態の動作と異なるものである。従って、図4において図2に示す構成要素に対応するものは同一の参照数字または符号を付し、その詳細な説明を省略するものとする。
FIG. 4 is a flowchart for explaining the operation of the second embodiment of FIG. The operation shown in FIG. 4 is different from the operation of the first embodiment only in that the operation of the partner information
図4において、電子メールの受信をきっかけとして、相手情報抽出処理装置3の制御部31が、受信電子メールデータベース4から受信した電子メールの取り込みを行い(図4のステップA1)、形態素解析部32では、制御部31から電子メール本文を受け取り、形態素解析/関係解析用辞書34を使用して形態素解析処理を行い(ステップA2)、関係解析部33では、形態素解析された結果を制御部31から受け取り、形態素解析/関係解析用辞書34を使用して関係解析処理を行い、相手情報の抽出処理を行う(ステップA3)。そして、関係解析部33で関係解析された結果は、制御部31に渡される。ここまでの動作は、図2で示したステップA1〜ステップA3までの動作と同一である。
In FIG. 4, triggered by reception of the email, the
次に、制御部31は関係解析された結果としての相手情報を、相手情報履歴管理部51に渡し、相手情報履歴管理部51は相手情報の履歴処理を行う(ステップB1)。相手情報の履歴処理とは、関係解析された結果としての相手情報(最新相手情報と称することとする)を相手情報データベース52に登録する際に、最新相手情報と同一カテゴリに属する既存情報が、相手情報データベース52に登録されているかを確認し、もし既存情報が登録されていた場合には、該既存情報に代えて最新相手情報を登録するものである(ステップA4)。このことにより、相手情報として過去の相手情報に代えて最新相手情報だけを閲覧できるようになる。既存情報が登録されていなかった場合には、第1の実施形態の動作と同様に、最新相手情報を相手情報データベース52に追加して登録する(ステップA4)。
Next, the
以上の処理の後、入力装置1を操作して、相手情報データベース52をアクセスすることにより、制御部31は相手情報データベース52から相手情報を検索して出力装置2に出力する(ステップA5)。このことにより、同一カテゴリに属する相手情報は、常に最新の相手情報だけを閲覧することが可能となる。
After the above processing, by operating the input device 1 and accessing the
次に、具体例を用いて、第2の実施形態の動作について再度説明する。 Next, the operation of the second embodiment will be described again using a specific example.
例えば、相手情報データベース52には、「職業カテゴリ」として「高校生」を有する既存の相手情報が登録されているものとする。
For example, it is assumed that existing partner information having “high school student” as “profession category” is registered in the
そして、第1の実施形態の具体例で示したと同様に、受信電子メールデータベース4には、「私は大学生になりました!」という電子メール本文を含む電子メールがあるものとする。また、形態素解析/関係解析用辞書34に、「xは大学生になりました」という文章から「x=大学生」という相手情報を抽出するというルールと、「職業:大学生」(「大学生」を相手情報データベース5の「職業カテゴリ」として登録する)というルールと、「私:メール送信者」(行為者が「私」である場合には相手情報データベース5に登録する)というルールと、が記憶・格納されているものとする。
As in the specific example of the first embodiment, it is assumed that the received e-mail database 4 includes an e-mail including an e-mail text “I am a college student!”. Also, in the
図4のステップA1〜ステップA3の動作により、「私=大学生」という情報が抽出される。また、「私:メール送信者」というルールにより、「私=大学生」という情報が相手情報データベース52に登録される対象情報であることがわかる。さらに、「職業:大学生」というルールにより、「大学生」は相手情報データベース52の「職業カテゴリ」として登録されるものであることがわかる。
The information “I = university student” is extracted by the operations of step A1 to step A3 in FIG. In addition, the rule “I: mail sender” indicates that the information “I = university student” is the target information registered in the
この結果、相手情報履歴処理装置50における相手情報履歴管理部51では、相手情報データベース52の「職業カテゴリ」に対して既存情報が登録されているかの確認処理を行う。このとき「職業カテゴリ」として「高校生」が登録されていることが判明するが、そのタイムスタンプにより、過去の相手情報であると判断する(図4のステップB1)。
As a result, the partner information
このことにより、相手情報データベース52の「職業カテゴリ」において、過去の相手情報である「高校生」を削除し、代わりに、最新相手情報であるところの「大学生」として登録しなおす(図4のステップA4)。
As a result, in the “profession category” of the
以上の処理の後、入力装置1を操作して、相手情報データベース52をアクセスすることにより、今回のメール送信者は、現在、高校生ではなく、大学生であるという情報のみを出力装置2を通じて閲覧することが可能となる(図4のステップA5)。
After the above processing, by operating the input device 1 and accessing the
以上説明したように、本発明の第2の実施形態によれば、相手情報履歴処理装置50によって相手情報の履歴処理を行っているため、相手情報を閲覧するに際し、最新の相手情報のみを閲覧することが可能となる、という効果を奏することができる。 As described above, according to the second embodiment of the present invention, since the partner information history processing device 50 performs the partner information history process, when browsing the partner information, only the latest partner information is browsed. The effect that it becomes possible can be produced.
1 入力装置
2 出力装置
3 相手情報抽出処理装置
31 制御部
32 形態素解析部
33 関係解析部
34 形態素解析/関係解析用辞書
35 記憶部
4 受信電子メールデータベース
5 相手情報データベース
50 相手情報履歴処理装置
51 相手情報履歴管理部
52 相手情報データベース
9 携帯端末
DESCRIPTION OF SYMBOLS 1
Claims (12)
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる制御と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる制御と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する制御と、を行う制御部と、
を備えることを特徴とする自然言語処理装置。 A natural language processing device for extracting partner information including attributes and status of a partner with whom an email is exchanged from a received email and registering it in the partner information database,
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. A dictionary for analysis and relation analysis,
Control for causing the morpheme analysis unit to analyze the email body of the received email, control for causing the relationship analysis unit to perform relationship analysis based on the analysis result of the morpheme analysis unit, and execution of the partner information extraction process, and the relationship analysis A control unit for performing the control of adding the e-mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the unit and registering the information in the counterpart information database;
A natural language processing apparatus comprising:
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、を備え、
前記自然言語処理装置が、受信電子メールの電子メール本文を前記形態素解析部に形態素解析させるステップと、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させるステップと、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録するステップと、を実行することを特徴とする自然言語処理方法。 In a natural language processing apparatus that extracts partner information consisting of attributes and status of a partner with whom an email is exchanged from a received email and registers it in the partner information database.
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. And a dictionary for analysis and relation analysis,
The natural language processing device causes the morphological analysis unit to analyze the email body of the received e-mail, and causes the relationship analysis unit to analyze the relationship from the analysis result of the morpheme analysis unit, and executes partner information extraction processing And a step of adding a mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the relation analysis unit and registering the result in the partner information database. A natural language processing method characterized.
前記形態素解析部の解析結果を元に電子メールをやりとりしている相手の属性や状況などからなる相手情報を抽出する処理を行う関係解析部と、
相手情報として相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、を備え、受信電子メールから相手情報を抽出して前記相手情報データベースに登録する自然言語処理装置のコンピュータに、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる処理と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる処理と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する処理と、を実行させることを特徴とするプログラム。 A morpheme analyzer that performs processing to divide a sentence included in the received e-mail into words;
A relational analysis unit that performs processing to extract partner information consisting of attributes and status of a partner who is exchanging e-mails based on the analysis result of the morphological analysis unit;
Morphological analysis that is stored in the partner information database as partner information and stores the minimum necessary words and relation analysis rules, and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing A relational analysis dictionary, and a computer of a natural language processing device that extracts partner information from received e-mail and registers it in the partner information database;
A process for causing the morphological analysis unit to analyze the body of the email of the received e-mail, a process for causing the relational analysis unit to perform a relational analysis based on an analysis result of the morpheme analysis part, and a process for executing the partner information extraction process And a process of registering in the partner information database with the mail address and time stamp information of the e-mail header information of the received e-mail added to the result of the part extraction process.
前記自然言語処理装置は、受信電子メールに含まれる文章を単語単位に分割する処理を行う形態素解析部と、
前記形態素解析部の解析結果を元に相手情報を抽出する処理を行う関係解析部と、
相手情報として前記相手情報データベースに登録する上で必要となる必要最小限の単語と関係解析用ルールとを記憶し前記形態素解析部及び前記関係解析部が解析・抽出処理を行う際に参照する形態素解析・関係解析用辞書と、
受信電子メールの電子メール本文を前記形態素解析部に形態素解析させる制御と、前記形態素解析部の解析結果から前記関係解析部に関係解析させて相手情報の抽出処理を実行させる制御と、前記関係解析部の抽出処理の結果に前記受信電子メールの電子メールヘッダ情報のメールアドレスとタイムスタンプの情報を付与して前記相手情報データベースに登録する制御と、を行う制御部と、
を備えることを特徴とする自然言語処理装置を搭載した携帯端末。 A mobile terminal equipped with a natural language processing device that extracts partner information including attributes and status of the partner with whom the email is exchanged from the received email and registers it in the partner information database,
The natural language processing device includes a morpheme analyzer that performs processing to divide a sentence included in a received email into words.
A relation analysis unit that performs processing to extract partner information based on the analysis result of the morphological analysis unit;
A morpheme that is stored as the partner information in the partner information database and stores the minimum necessary words and relation analysis rules and is referred to when the morpheme analysis unit and the relationship analysis unit perform analysis / extraction processing. A dictionary for analysis and relation analysis,
Control for causing the morpheme analysis unit to analyze the email body of the received email, control for causing the relationship analysis unit to perform relationship analysis based on the analysis result of the morpheme analysis unit, and execution of the partner information extraction process, and the relationship analysis A control unit for performing the control of adding the e-mail address and time stamp information of the e-mail header information of the received e-mail to the result of the extraction process of the unit and registering the information in the counterpart information database;
A portable terminal equipped with a natural language processing device.
When the natural language processing device obtains the browsing request information of the partner information from the input device, it searches the partner information database, extracts the partner information that matches the browsing request information, and outputs it to the output device. A portable terminal equipped with the natural language processing device according to any one of claims 10 and 11.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003421294A JP2005182400A (en) | 2003-12-18 | 2003-12-18 | Natural language processor, processing method and program, and portable terminal loaded with natural language processor |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003421294A JP2005182400A (en) | 2003-12-18 | 2003-12-18 | Natural language processor, processing method and program, and portable terminal loaded with natural language processor |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2005182400A true JP2005182400A (en) | 2005-07-07 |
Family
ID=34782559
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003421294A Pending JP2005182400A (en) | 2003-12-18 | 2003-12-18 | Natural language processor, processing method and program, and portable terminal loaded with natural language processor |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2005182400A (en) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008335A (en) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | Relationship creation device, and method |
-
2003
- 2003-12-18 JP JP2003421294A patent/JP2005182400A/en active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013008335A (en) * | 2011-06-27 | 2013-01-10 | Yahoo Japan Corp | Relationship creation device, and method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7163355B2 (en) | Identification of tasks in messages | |
US9183535B2 (en) | Social network model for semantic processing | |
US8688690B2 (en) | Method for calculating semantic similarities between messages and conversations based on enhanced entity extraction | |
US9880997B2 (en) | Inferring type classifications from natural language text | |
US8825472B2 (en) | Automated message attachment labeling using feature selection in message content | |
KR101716905B1 (en) | Method for calculating entity similarities | |
US9720904B2 (en) | Generating training data for disambiguation | |
US7328193B2 (en) | Summary evaluation apparatus and method, and computer-readable recording medium in which summary evaluation program is recorded | |
CN110914824A (en) | Removing sensitive content from a document while preserving document usefulness for subsequent processing | |
US10460041B2 (en) | Efficient string search | |
CN113692597A (en) | E-mail content modification system | |
US7269789B2 (en) | Document information processing apparatus | |
CN112149403A (en) | Method and device for determining confidential text | |
US20080154871A1 (en) | Method and Apparatus for Mobile Information Access in Natural Language | |
CN111555960A (en) | Method for generating information | |
JP2010049633A (en) | Information processor and program | |
US7693907B1 (en) | Selection for a mobile device using weighted virtual titles | |
CN113743107A (en) | Entity word extraction method and device and electronic equipment | |
JP5954053B2 (en) | Search support system, search support method, and computer program | |
JP2005182400A (en) | Natural language processor, processing method and program, and portable terminal loaded with natural language processor | |
CN114661852B (en) | Text search method, terminal, and readable storage medium | |
CN116579333A (en) | Keyword extraction method, device, computer equipment and storage medium | |
JP2007272699A (en) | Document indexing device, document search device, document classification device, method and program thereof | |
JP2001101184A (en) | Structured document generation method and apparatus, and storage medium storing structured document generation program | |
US20250190476A1 (en) | Tagging telecommunication interactions |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20061115 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20070118 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20080612 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090430 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20090511 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090630 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090825 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090929 |