[go: up one dir, main page]

JP3379633B2 - Active message generation method and apparatus, and recording medium recording active message generation program - Google Patents

Active message generation method and apparatus, and recording medium recording active message generation program

Info

Publication number
JP3379633B2
JP3379633B2 JP34013397A JP34013397A JP3379633B2 JP 3379633 B2 JP3379633 B2 JP 3379633B2 JP 34013397 A JP34013397 A JP 34013397A JP 34013397 A JP34013397 A JP 34013397A JP 3379633 B2 JP3379633 B2 JP 3379633B2
Authority
JP
Japan
Prior art keywords
message
active
basic
output
semantic network
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP34013397A
Other languages
Japanese (ja)
Other versions
JPH11175526A (en
Inventor
博人 稲垣
和宏 早川
孝史 井上
一男 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
NTT Inc
Original Assignee
Nippon Telegraph and Telephone Corp
NTT Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp, NTT Inc filed Critical Nippon Telegraph and Telephone Corp
Priority to JP34013397A priority Critical patent/JP3379633B2/en
Publication of JPH11175526A publication Critical patent/JPH11175526A/en
Application granted granted Critical
Publication of JP3379633B2 publication Critical patent/JP3379633B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Information Transfer Between Computers (AREA)
  • Computer And Data Communications (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、電子メールやTE
LEXなどの通信文において、メッセージ内容を解析
し、定型的な表現は定型表現に変換し、また、メッセー
ジの中でメッセージを受け取る受信者にとって意味を持
つアクティブなメッセージのみを抽出するアクティブメ
ッセージを生成する方法と装置に関する。
TECHNICAL FIELD The present invention relates to electronic mail and TE.
In a communication message such as LEX, message contents are analyzed, a canonical expression is converted to an canonical expression, and an active message is extracted that extracts only active messages that have meaning to a recipient who receives the message. Method and apparatus.

【0002】[0002]

【従来の技術】従来、文章を要約したり、抄録する装置
においては、文章を解析して、所望の要約を構文解析
し、文章を構成している各文の連結関係や、接続詞など
の情報により文間の関係や文の重みづけを行い、重みの
高いものから順に表示し、重みの軽い文を文章から除く
ことにより要約(または、抄録)を自動作成していた。
2. Description of the Related Art Conventionally, in a device for summarizing or abstracting a sentence, the sentence is analyzed, the desired summary is syntactically analyzed, and the information such as the connection relation of each sentence constituting the sentence, the conjunction, etc. The relations between sentences and the weight of sentences were done by, and the summary (or abstract) was automatically created by displaying the sentences with the highest weight in order and excluding the sentences with the light weight from the sentences.

【0003】[0003]

【発明が解決しようとする課題】上述した従来の装置で
は、文の連結関係は、接続詞などだけでは決定されるこ
とができず、適切な自動要約を行うことができなかっ
た。
In the above-mentioned conventional apparatus, the connection relation of sentences cannot be determined only by the connectives and the like, and proper automatic summarization cannot be performed.

【0004】本発明の目的は、メッセージ内容をメッセ
ージ受信者にとって冗長性が少なく、かつ最も情報量が
多い形で適切に表示するアクティブメッセージ生成方法
および装置ならびにアクティブメッセージ生成プログラ
ムを記録した記録媒体を提供することにある。
An object of the present invention is to provide an active message generating method and apparatus for appropriately displaying the message contents in a form having a minimum amount of information with little redundancy for a message receiver and a recording medium recording the active message generating program. To provide.

【0005】[0005]

【課題を解決するための手段】本発明のアクティブメッ
セージ生成方法は、メッセージの中でメッセージを受け
取る受信者にとって意味をもつアクティブなメッセージ
のみを生成する装置における処理であって、 前記装置に
は、意味素と意味素の役割からなる意味素ネットワーク
で構成された複数の定型メッセージが蓄積されており、
基本メッセージを入力する段階と、前記入力された基本
メッセージを形態素解析する段階と、形態素解析結果か
ら係り受け解析を行い、前記基本メッセージを意味素と
意味素の役割からなる意味素ネットワークで構成する段
階と、 前記基本メッセージの意味素ネットワークが定型
メッセージの意味素ネットワークを充足しているとき、
前記基本メッセージが定型メッセージに一致すると判定
し、一致する場合、意味素ネットワークの一致の度合い
を求め、最も尤度の高い定型メッセージを出力する段階
と、前記出力結果に基づいて、前記基本メッセージの中
で前記定型メッセージと類似している部分を定型メッセ
ージに変換する段階と、前記基本メッセージの中でメッ
セージを受け取る受信者にとって意味を持つアクティブ
な内容のみを抽出する段階と、前記変換された基本メッ
セージの中で、前記アクティブな内容に相当するアクテ
ィブメッセージだけを出力する段階とを有する。
SUMMARY OF THE INVENTION The method of generating an active message of the present invention involves receiving a message among messages.
Active messages that make sense for the recipients to take
A process in an apparatus for generating only, the device
Is a semantic network consisting of semantics and roles of semantics
Multiple standard messages composed of are stored,
A step for inputting a basic message, a step of morphological analysis the input base message, or the result of morphological analysis
Dependency analysis is performed, and the basic message is regarded as a semantic element.
A stage consisting of a semantic network consisting of the roles of semantics
The floor and the semantic network of the basic message are standard
When the message's semantic network is satisfied,
Determined that the basic message matches the standard message
If they match, the degree of matching of the semantic network
The calculated, and outputting the highest likelihood fixed message, and converting on the basis of the output result, the fixed message parts that are similar to the fixed message in the base message, the basic message Extracting only active content that is meaningful to the recipient receiving the message, and outputting only the active message corresponding to the active content in the converted basic message. And stages.

【0006】また、本発明のアクティブメッセージ生成
装置は、基本メッセージを入力する基本メッセージ入力
手段と、前記入力された基本メッセージの全ての文字に
対して形態素解析用辞書を用いて形態素候補を抽出し、
全ての形態素候補が抽出された後、各形態の使用される
度合いを示す各形態素のノードコストおよび各形態素候
補間の接続の可能性を示す尺度であるリンクコストを求
め、これら形態素候補の組合せに対するノードコストお
よびリンクコストの総和の低い順に並べ、コストの最も
少ない候補を形態素解析結果として出力し、該形態素解
析結果から係り受け解析を行い、前記基本メッセージを
意味素と意味素の役割からなる意味素ネットワークで構
成する基本メッセージ解析手段と、定型メッセージを意
味素ネットワークで構成し、複数の定型メッセージの意
味素ネットワークを蓄積する定型メッセージ蓄積手段
と、 前記基本メッセージの意味素ネットワークが定型メ
ッセージの意味素ネットワークを充足しているとき、前
記基本メッセージが定型メッセージに一致すると判定
し、一致する場合、意味素ネットワークの一致の度合い
を求め、最も尤度の高い定型メッセージを出力するメッ
セージ比較手段と、前記メッセージ比較手段の結果に基
づいて、前記基本メッセージの中で前記定型メッセージ
と類似している部分を定型メッセージに変換するメッセ
ージ定型化手段と、前記基本メッセージの中で、メッセ
ージを受け取る受信者にとって意味を持つアクティブな
内容のみを抽出するアクティブメッセージ抽出手段と、
前記変換された基本メッセージの中で前記アクティブな
内容に相当するアクティブメッセージだけを出力するア
クティブメッセージ出力手段とを有する。
Further, the active message generating apparatus of the present invention has a basic message inputting means for inputting a basic message and all characters of the input basic message.
On the other hand, morpheme candidates are extracted using the morpheme analysis dictionary,
Used for each morphology after all morpheme candidates have been extracted
Node cost of each morpheme indicating degree and each morpheme
Obtain the link cost, which is a measure of the possibility of interpolation connection.
Therefore, the node cost and
And the link cost from the lowest total
Output few candidates as morphological analysis results,
Dependency analysis is performed from the analysis result and the basic message
A semantic network composed of semantics and roles of semantics
The basic message analysis means and standard messages
It is composed of Ajinomoto Network, and has the meaning of multiple standard messages.
A standard message storage means for storing Ajinomoto Networks
And the semantic network of the basic message is
When the message network of Sage is satisfied,
Judge that the basic message matches the standard message
If they match, the degree of matching of the semantic network
And a message comparing means for outputting the most likely fixed message, and a message for converting a portion of the basic message similar to the fixed message into a fixed message based on the result of the message comparing means. Stylizing means, active message extracting means for extracting only active content that has meaning to a recipient who receives the message from the basic message,
And an active message output means for outputting only an active message corresponding to the active content in the converted basic message.

【0007】また、本発明の、コンピュータ読取り可能
記録媒体は、基本メッセージを入力する処理と、前記
入力された基本メッセージを形態素解析する処理と、形
態素解析結果から係り受け解析を行い、前記基本メッセ
ージを意味素と意味素の役割からなる意味素ネットワー
クで構成する処理と、意味素ネットワークで構成された
複数の定型メッセージを読み込む処理と、前記基本メッ
セージの意味素ネットワークが定型メッセージの意味素
ネットワークを充足しているとき、前記基本メッセージ
が定型メッセージに一致すると判定し、一致する場合、
意味素ネットワークの一致の度合いを求め、最も尤度の
高い定型メッセージを出力する処理と、前記出力結果に
基いて、前記基本メッセージの中で前記定型メッセージ
と類似している部分を定型メッセージに変換する処理
と、前記メッセージの中で、メッセージを受け取る受信
者にとって意味を持つアクティブな内容のみを抽出する
処理と、前記変換された定型メッセージの中で前記アク
ティブな内容に相当するアクティブメッセージだけを出
力する処理とをコンピュータに実行させるためのアクテ
ィブメッセージ生成プログラムを記録している。
The invention is also computer readable.
The recording medium includes a process of inputting a basic message, a process of morphological analysis of the input basic message, and a dependency analysis based on the morphological analysis result, and the basic message has a meaning and a meaning consisting of roles of semantics. A process of configuring a basic network, a process of reading a plurality of standard messages configured of a semantic network, and the basic message is a standard message when the semantic network of the basic message satisfies the semantic network of the standard message. It is determined that the message matches, and if it matches,
A process of obtaining the degree of coincidence of the semantic network and outputting a fixed message having the highest likelihood, and based on the output result, a part of the basic message similar to the fixed message is converted into a fixed message. Processing, extracting only active content that has meaning to a recipient who receives the message from the message, and outputting only active message corresponding to the active content in the converted boilerplate message And the activity that causes the computer to execute
The live message generator.

【0008】本発明のアクティブメッセージ生成装置
は、自動文章要約装置とは異なり、メッセージ文の中の
アクティブな内容に関する部分を抽出するとともに、定
型的な表現は、システムの持つ定型文に変換することに
より、メッセージ受信者が最も適した形でのアクティブ
メッセージを生成することができる。
Unlike the automatic sentence summarizing device, the active message generating device of the present invention extracts a part related to active contents in a message sentence, and converts a fixed expression into a fixed sentence held by the system. This allows the message recipient to generate the most suitable active message.

【0009】[0009]

【発明の実施の形態】次に、本発明の実施の形態につい
て図面を参照して説明する。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, embodiments of the present invention will be described with reference to the drawings.

【0010】図1を参照すると、本発明の一実施形態の
アクティブメッセージ生成装置は、基本メッセージMを
入力するインタフェ−スを司る基本メッセージ入力部1
と、基本メッセージ入力部1が入力した基本メッセージ
Mを自然言語解析する基本メッセージ解析部2と、基本
メッセージ解析部2が解析した基本メッセージMの内容
と既存型テキストの比較用データとを比較し、類似して
いるかどうかを示す比較結果を出力するメッセージ比較
部3と、メッセージ比較部3の比較結果を取得して、基
本メッセージMの中で定型メッセージと類似しているメ
ッセージ部分を抽出し、該定型メッセージに変換するメ
ッセージ定型化部4と、基本メッセージ解析部2の基本
メッセージMの解析結果をもとに、基本メッセージMの
中で、メッセージを受け取る受信者にとって意味を持つ
アクティブなメッセージ部分だけを抽出するアクティブ
メッセージ抽出部5と、メッセージ定型化部4の出力と
アクティブメッセージ抽出部5の出力を比較し、変換さ
れた定型メッセージの中で、アクティブな内容に相当す
るアクティブメッセージAを出力するインタフェース部
分であるアクティブメッセージ出力部6で構成されてい
る。
Referring to FIG. 1, an active message generating apparatus according to an embodiment of the present invention includes a basic message input unit 1 that controls an interface for inputting a basic message M.
And a basic message analysis unit 2 that analyzes the basic message M input by the basic message input unit 1 in a natural language, and the contents of the basic message M analyzed by the basic message analysis unit 2 and comparison data of existing text. , A message comparison unit 3 that outputs a comparison result indicating whether or not they are similar to each other, a comparison result of the message comparison unit 3 is acquired, and a message portion similar to the standard message is extracted from the basic message M, Based on the analysis result of the basic message M by the message standardization unit 4 and the basic message analysis unit 2 for converting into the fixed message, an active message portion in the basic message M that has meaning to the recipient who receives the message. Only the active message extractor 5 that extracts only the output of the message stylization unit 4 and the active message Comparing the output of the di-extraction unit 5, in the converted fixed message is configured in the active message output unit 6 is an interface portion for outputting an active message A corresponding to active content.

【0011】次に、各部の処理を具体例により詳細に説
明する。
Next, the processing of each unit will be described in detail with a concrete example.

【0012】基本メッセージ入力部1は、基本メッセー
ジMを入力するインタフェースを司っている。基本メッ
セージMには種々の形式がある。最も単純な形は、メッ
セージのBODYだけがある例(図2(1))である。
また、メッセージ書誌事項が記述され、それに関するメ
ッセージBODYがある例(図2(2))もある。
The basic message input unit 1 controls an interface for inputting the basic message M. The basic message M has various formats. The simplest form is an example where there is only BODY of the message (FIG. 2 (1)).
There is also an example (FIG. 2 (2)) in which a message bibliographic item is described and there is a message BODY related to it.

【0013】電子メールでは、上記例以外に書誌事項と
して、図3に示すような書誌事項がある。電子メールに
おける書誌事項の意味を左側に“#”以降に示す。
In the electronic mail, in addition to the above example, there are bibliographic items as shown in FIG. The meaning of the bibliographic items in the e-mail is shown on the left side after "#".

【0014】電子メールでは、送り先の名称は、図4の
ような規則となっている。ユーザ名の個所に適切なユー
ザを識別する名称(例えば“taro”)が記述され
る。もちろん、漢字コードの使用は許されておらず、7
ビットで表わされるIA−5(ASCII)で記述され
る。同様に、マシン名も階層的に表示され、“nnn.
co.jp”のようなドメイン名(jpが日本を意味
し、coが企業を意味する。また、nnnは企業の中の
一企業体を表す。)が記述される。また、Subjec
tは、電子メールでは規定されていないが、通信文の概
要を示したり、その通信文がどのような内容であるかを
分類されるための分類名が付与されたりする。例えば、
“Subject:[一般]今日のテストについて”。
ただし、通常、電子メールでは、Subject自体も
通信相手先名称と同様に、ASCIIで表示するか、M
IMEという特殊な識別子によりバイナリー化された漢
字が埋め込まれる。ここでは、読みやすいように漢字で
表記した。
In the electronic mail, the name of the destination has a rule as shown in FIG. A name for identifying an appropriate user (for example, "taro") is described in the place of the user name. Of course, the use of Kanji code is not allowed, and 7
It is described in IA-5 (ASCII) represented by bits. Similarly, the machine name is also displayed hierarchically, and "nnn.
co. A domain name such as “jp” (jp means Japan, co means a company, and nnn means one of the companies) is described.
Although t is not specified in the e-mail, it may indicate the outline of the communication message, or may be given a classification name for classifying the content of the communication message. For example,
“Subject: [General] About Today's Testing”.
However, normally, in an e-mail, the Subject itself is displayed in ASCII as well as the communication destination name, or M
Binaryized Chinese characters are embedded by a special identifier called IME. Here, it is written in Kanji for easy reading.

【0015】基本メッセージ解析部2は、基本メッセー
ジMを解析する。まず、形態素解析用辞書により、品
詞、読みなどが付与され、最も尤度の高い形態素解析結
果が抽出される。
The basic message analysis unit 2 analyzes the basic message M. First, the morphological analysis dictionary adds a part of speech, reading, and the like, and the morphological analysis result with the highest likelihood is extracted.

【0016】図5は、基本メッセージMの例1(図2
(1))を形態素解析した例である。図5の例でわかる
ように、形態素解析では、基本メッセージMの形態素候
補を形態素解析用辞書で抽出する。例えば、図6のよう
な候補を抽出する。“テスト”の場合、形態素を記述す
る。該形態素に対する品詞を括弧づけで後に記述する。
“テストの”の場合、上記“テスト”と“の”の組み合
わせ全てが形態素候補ということになる(図7)。
FIG. 5 shows an example 1 of the basic message M (see FIG. 2).
It is an example of morphological analysis of (1)). As can be seen from the example of FIG. 5, in the morphological analysis, the morphological candidate of the basic message M is extracted by the morphological analysis dictionary. For example, the candidates shown in FIG. 6 are extracted. In the case of "test", describe the morpheme. The part of speech for the morpheme will be described later in parentheses.
In the case of "test", all combinations of "test" and "no" are morpheme candidates (FIG. 7).

【0017】同様な形態素候補の抽出を入力された全て
の文字に対して行う。最終的に、全ての形態素候補が抽
出された後、各形態素候補間のリンクコスト(接続の可
能性を表す尺度;ここでは、大きいほど接続の可能性が
低いとする。)を求める。各リンクコストは、各品詞ご
と、または各形態素ごとに決められる。図8がその例で
ある。
Similar morpheme candidate extraction is performed for all input characters. Finally, after all the morpheme candidates have been extracted, the link cost between the morpheme candidates (a measure representing the possibility of connection; here, the larger the cost, the lower the possibility of connection). Each link cost is determined for each part of speech or each morpheme. FIG. 8 shows an example.

【0018】また、各単語に、ノードコスト(各単語の
漢字として使われる度合いを表わす尺度;ここでは、大
きいほど使われることが少ないことを表す。)を抽出す
る(図9)。
Further, a node cost (a scale indicating the degree of use as a kanji of each word; here, the larger the number, the less used) is extracted from each word (FIG. 9).

【0019】ここで、形態素解析候補のコストは以下の
式で表される。
Here, the cost of the morphological analysis candidate is expressed by the following equation.

【0020】[0020]

【数1】 この形態素解析候補のノードコストとリンクコストの合
計が最も小さい候補が尤度の高い形態素解析候補という
ことになる。また、本形態素解析方式をコスト最少法と
呼ぶ。
[Equation 1] The candidate having the smallest sum of the node cost and the link cost of the morpheme analysis candidates is the morpheme analysis candidate with high likelihood. Moreover, this morphological analysis method is called a cost minimum method.

【0021】上記基本メッセージMの例文の“テスト
の”の部分だけコストを求めると、図10のようにな
る。
FIG. 10 shows the cost when only the "test" portion of the example sentence of the basic message M is obtained.

【0022】最終的に、形態素候補の組み合わせをコス
トの低い順にならべ、最もコストの少ない候補を形態素
解析結果として取り出す。上記例を形態素解析候補のコ
ストの低い順に並べ替えると図11のようになる。
Finally, the combinations of morpheme candidates are arranged in ascending order of cost, and the candidate with the lowest cost is taken out as the morpheme analysis result. The above example is rearranged in ascending order of cost of morpheme analysis candidates, as shown in FIG.

【0023】最終的に、形態素候補の組み合わせをコス
トの低い順に並べ、最もコストの少ない候補を取り出
す。上記例では、“テスト(サ変名詞.語幹)+を(格
助詞.を)”の組み合わせが形態素解析結果となる。
Finally, the combinations of morpheme candidates are arranged in ascending order of cost, and the candidate with the lowest cost is taken out. In the above example, the combination of "test (sahen noun. Stem) + wo (case particle. Wo)" is the morphological analysis result.

【0024】この形態素解析結果から、さらに、係り受
け解析を行う。係り受け解析は、稲垣らが出願している
特許「係り受け解析方法」(特願昭62−17301
1)などを用いる。
From this morphological analysis result, dependency analysis is further performed. Dependency analysis is performed by the patent “Dependency Analysis Method” filed by Inagaki et al. (Japanese Patent Application No. 62-17301).
1) etc. are used.

【0025】基本メッセージMの例1は図12のような
係り受け解析となる。
Example 1 of the basic message M is the dependency analysis as shown in FIG.

【0026】基本メッセージMの例2を図13に示す
と、基本メッセージMの例2は図14のような係り受け
解析となる。
When Example 2 of the basic message M is shown in FIG. 13, Example 2 of the basic message M is the dependency analysis as shown in FIG.

【0027】メッセージ比較部3では、装置側で既に持
っている定型文と基本メッセージ解析部2で解析した基
本メッセージMとを比較し、類似しているかどうかを判
定する。定型メッセージは、メッセージの使用される分
野により異なる。例えば、PHSや携帯電話などで行わ
れているメッセージ交換サービスの場合、定型メッセー
ジとしては、図15のようなメッセージ文が考えられ
る。
The message comparison unit 3 compares the fixed text already held on the device side with the basic message M analyzed by the basic message analysis unit 2 to determine whether or not they are similar. The standard message depends on the field in which the message is used. For example, in the case of a message exchange service provided by PHS, mobile phones, etc., a message as shown in FIG. 15 can be considered as a standard message.

【0028】また、ある意味を表す短い意味記号があ
り、これらも同様に定型文と同じように扱う。例えば、
PHSや携帯電話などで行われているメッセージ交換サ
ービスの場合、図16のような意味記号が考えられる。
There are also short meaning symbols that represent a certain meaning, and these are also treated in the same way as fixed phrases. For example,
In the case of a message exchange service provided by PHS, mobile phones, etc., the meaning symbols as shown in FIG. 16 are conceivable.

【0029】これらは、メッセージ比較部3で処理され
る前に、自動メッセージ解析されるか、または、人手で
メッセージ解析が行われる。メッセージ解析では、基本
メッセージ解析部2で解析された係り受け解析から意味
解析を行い、メッセージを意味素と意味素の役割からな
るネットワークで構成する。意味素とは、それぞれの単
語の代表する意味とそれぞれの組み合わせをネットワー
ク的に表現したもの(ここでは、それらを意味素ネット
ワークと呼ぶ)である。自動的に意味解析を行う方法と
しては、稲垣らが発明した「パターン誘導型文書内容解
析装置」(特開平7−129588)などを利用する。
例えば、(3−1)(3−2)(3−3)の基本メッセ
ージ文は図17のようになる、意味素の役割をボックス
で囲む。意味素の役割は、agent, time, location, ac
t, objectなどである。(4−1)なども基本的には、
意味素ネットワークに変換される。図18にその例を示
す。(4−3)のように意味素が複数ある場合には、複
数の意味素ネットワークが定型文用に用意される。
Before these are processed by the message comparison unit 3, they are analyzed automatically or manually. In the message analysis, semantic analysis is performed from the dependency analysis analyzed by the basic message analysis unit 2, and the message is configured by a network having a semantic element and a role of the semantic element. A semantic element is a network representation of a representative meaning of each word and each combination (herein, they are called a semantic network). As a method of automatically performing the semantic analysis, a "pattern-guided document content analysis device" invented by Inagaki et al. (Japanese Patent Laid-Open No. 7-129588) is used.
For example, the basic message sentences (3-1) (3-2) (3-3) are as shown in FIG. 17, and the role of the semantic element is enclosed in a box. The role of semantics is agent, time, location, ac
t, object, etc. (4-1) etc. are basically
Converted to a semantic network. FIG. 18 shows an example thereof. When there are a plurality of semantic elements as in (4-3), a plurality of semantic element networks are prepared for fixed phrases.

【0030】このように、装置側で既に用意している定
型文については、装置側で、意味素ネットワークとして
蓄積している。一方、基本メッセージ解析部2の出力で
ある基本メッセージをここでは、意味素解析を行い、同
様な意味素ネットワークに変換する。例えば、基本メッ
セージ文(2−3)や(2−4)は図19のような意味
素ネットワークになる。
In this way, the fixed texts already prepared on the device side are stored as a semantic network on the device side. On the other hand, here, the basic message output from the basic message analysis unit 2 is subjected to semantic analysis, and converted into a similar semantic network. For example, the basic message sentences (2-3) and (2-4) become a semantic network as shown in FIG.

【0031】このように、基本メッセージMの意味素が
解析された後、定型文と比較を行う。比較の場合、定型
文の意味素ネットワークを充足している意味素ネットワ
ークを一致したと判定する。すなわち、比較する2つの
意味素ネットワークが同じネットワーク形状をしてお
り、さらにネットワーク端についている意味素の内容が
1つでも同じ要素があると、一致したと判定する。一致
する場合は、充足度を比較する対象の2つの各意味素ネ
ットワークの一致の度合い(ネットワーク形状や、ネッ
トワーク端の意味素の一致を数値的に表したもの)と
し、最も尤度の高い(一致の度合いの高いもの)候補を
出力する。例えば、基本メッセージMの例2では、図2
0に示すように、(2−4)と定型文(3−3)が最も
意味素ネットワークの充足度が高い。(2)の基本メッ
セージMでは、図21のような情報がメッセージ比較部
3から送られる。
In this way, after the semantics of the basic message M are analyzed, they are compared with the fixed form sentence. In the case of comparison, it is determined that the semantic network satisfying the semantic network of the standard sentence is the same. That is, if the two semantics networks to be compared have the same network shape and there is even one element of the content of the semantics at the network end, it is determined that they match. If they match, the degree of matching between the two semantic networks that are the targets of comparison of the sufficiency (a numerical representation of the network shape and the matching of the semantics at the network ends) is set, and the highest likelihood ( The ones with a high degree of matching) are output. For example, in Example 2 of the basic message M, as shown in FIG.
As shown in 0, (2-4) and the fixed sentence (3-3) have the highest degree of sufficiency of the semantic network. In the basic message M of (2), the information as shown in FIG. 21 is sent from the message comparison unit 3.

【0032】メッセージ定型化部4では、メッセージ比
較部2からの出力を受けて、基本メッセージを定型化す
る。上記に示した(2)の基本メッセージMの例では、
一致する定型メッセージの定型メッセージ部がコード化
されて出力される。一致しない部分は自由文字としてそ
のまま出力される。例えば、コードのプリフィックス
(前置記号の意味;前置記号があるとその後例えば2つ
の数字が特定メッセージを表す、ここでは定型メッセー
ジのコードであるとする。)を“#”とすると、(2−
4)のメッセージは、図22のようになる。全ての基本
メッセージ文に関して同様な処理を行う。
The message stylization unit 4 receives the output from the message comparison unit 2 and stylizes the basic message. In the example of the basic message M of (2) shown above,
The standard message part of the matching standard message is encoded and output. The part that does not match is output as it is as a free character. For example, if the prefix of the code (the meaning of the prefix; if there is a prefix, then two numbers represent a specific message, for example, here is the code of a fixed message) is “#”, (2 −
The message of 4) is as shown in FIG. Do the same for all basic message texts.

【0033】アクティブメッセージ抽出部5では、基本
メッセージ文中での、アクティブなメッセージだけ抽出
する部分である。基本メッセージのアクティブ解析を行
う方法としては、稲垣らの発明した「事象解析器」(特
願平3−261306)などがある。これは、文内のア
クティブなメッセージだけを選択し、さらにその意味を
解析する装置である。「事象解析器」では、まず、対象
となる入力文を短文単位(1つの文の中に1つのアクテ
ィブなメッセージがある文の単位)に分割し、各短文を
自然言語解析する。短文単位の形態素解析結果を用い
て、アクティブな文であるかどうかを判定し、アクティ
ブな文の場合、その意味構造を取得する。基本メッセー
ジMの例2を用いて説明する。
The active message extractor 5 is a part for extracting only active messages in the basic message sentence. As a method for active analysis of a basic message, there is an "event analyzer" (Japanese Patent Application No. 3-261306) invented by Inagaki et al. It is a device that selects only the active messages in a sentence and analyzes their meaning. In the "event analyzer", first, a target input sentence is divided into short sentence units (units of sentences having one active message in one sentence), and each short sentence is subjected to natural language analysis. It is determined whether or not the sentence is an active sentence by using the morphological analysis result in units of short sentences, and in the case of the active sentence, the semantic structure of the sentence is acquired. An example 2 of the basic message M will be described.

【0034】基本メッセージでは、(2−3)が複数の
アクティブなメッセージ(“食事をする”というメッセ
ージと“帰る”という2つのアクティブなメッセージを
言う)を持っているため、2つの短文に区切られる(短
文の始まりを“<sentence>”で、終わりを</sentence>
で示す。)。基本メッセージMの例2は図23のような
短文単位になる。この基本メッセージMの例でいえば、
アクティブなメッセージは、(2−3)part1,2と
(2−4)だけである。そのため、図24の文だけが基
本メッセージMから抽出される。
In the basic message, (2-3) has a plurality of active messages (a message of "meal" and two messages of "return"), so it is divided into two short sentences. (The beginning of the short sentence is “<sentence>” and the end is </ sentence>
Indicate. ). Example 2 of the basic message M is in short sentence units as shown in FIG. In the example of this basic message M,
The only active messages are (2-3) parts 1, 2 and (2-4). Therefore, only the sentence of FIG. 24 is extracted from the basic message M.

【0035】さらに、アクティブ解析により、上記の文
が解析され、図25に示す意味構造が取得される。
Further, the above sentence is analyzed by the active analysis, and the semantic structure shown in FIG. 25 is acquired.

【0036】アクティブメッセージ出力部6では、メッ
セージ定型化部4の出力とアクティブメッセージ抽出部
5の両方の出力を結合させ、最終的な出力機器に対して
出力するインタフェースである。基本メッセージMの例
2の場合、図26のような出力がメッセージ定型化部4
から出力される。さらに、アクティブメッセージ抽出部
5からは、図27のようなメッセージが出力される。
The active message output unit 6 is an interface that combines the outputs of the message stylization unit 4 and the active message extraction unit 5 and outputs the combined output to the final output device. In the case of the example 2 of the basic message M, the output as shown in FIG.
Is output from. Furthermore, the active message extraction unit 5 outputs a message as shown in FIG.

【0037】メッセージ定型化部4とアクティブメッセ
ージ抽出部5の出力から次のような規則で意味表示を抽
出する。
The meaning display is extracted from the outputs of the message stylization unit 4 and the active message extraction unit 5 according to the following rules.

【0038】−<sentence>タグ中に<sem >タグがな
い場合、<sentence>タグ内の文字列を出力する。
-If there is no <sem> tag in the <sentence> tag, the character string in the <sentence> tag is output.

【0039】−<sem >タグがある場合、<sem >タグ
のvalue 属性の値を接続して出力する。
-If there is a <sem> tag, the value of the value attribute of the <sem> tag is connected and output.

【0040】−<sem >タグがある場合、<sem >タグ
内の文字列を出力する。
-If there is a <sem> tag, the character string in the <sem> tag is output.

【0041】−<sentence>タグで、num が同じ場合、
全ての可能性を出力する。
-In the <sentence> tag, if num is the same,
Output all possibilities.

【0042】−<sem >タグのvalue 属性の値が括弧で
示される場合、出力機器に表示されるときと同じ場合、
同じ内容は表示しない。
-When the value of the value attribute of the <sem> tag is shown in parentheses, when it is the same as when it is displayed on the output device,
Do not display the same content.

【0043】−各タグの出力単位で、“+”で接続す
る。
-Connect by "+" for each tag output unit.

【0044】−<sentence>単位の区切れは、“×”と
する。
The division of <sentence> unit is "x".

【0045】上記規則で、基本メッセージMの例2は図
28のようになる。
According to the above rule, Example 2 of the basic message M is as shown in FIG.

【0046】各行の候補例を示したが、さらに、改行位
置を全ての単語の間に入れる候補を作成し、得点づけす
る。例えば、図29のようにする。得点づけの方法とし
て、出力機器への表示の最適度をポイントで表す。出力
機器への表示に適している場合、ポイント加算が行わ
れ、出力機器への表示に適していない場合、ポイント減
算(ペナラティ)が行われる。
Although an example of candidates for each line has been shown, a candidate for inserting a line feed position between all words is created and scored. For example, as shown in FIG. As a scoring method, the optimum degree of display on the output device is represented by points. If it is suitable for display on the output device, point addition is performed, and if it is not suitable for display on the output device, point subtraction (penalty) is performed.

【0047】ポイントを計算する項目の例を図30に示
す。
FIG. 30 shows an example of items for calculating points.

【0048】各項目に一致している候補の場合、該ポイ
ントを加える作業を行い、全ての項目に対して、一致し
ているかどうかを比較し、各テキスト変換候補をポイン
トづける。項目“改行位置を考慮したテキスト変換候補
の行*列”とは、改行位置を考慮したテキスト変換候補
が占める画面上での占有文字列(列については、画面サ
イズ(列)と同じであるとする。)が1画表示可文字数
より少ない場合を指す。
In the case of a candidate that matches each item, an operation of adding the point is performed, and it is compared whether all the items match, and each text conversion candidate is pointed. The item “text conversion candidate line * column considering line break position” means that the occupied character string on the screen occupied by the text conversion candidate considering line break position is the same as the screen size (column). Is less than the number of characters that can be displayed on one screen.

【0049】もし、最終的な出力機器が、プリフィック
ス付き定型文コードを受け取り可能な場合、プリフィッ
クス付きコードで出力機器に送信する。プリフィックス
を認識せず、2バイト文字しか認識しない場合には、定
型文でも2バイトコードに変換されて出力される。もち
ろん、出力機器の属性もそれぞれの出力機器特有の属性
を持つため、出力機器に最も適した表示を行わなければ
ならない。出力機器の属性としては、テキストが出力さ
れる機器の画面サイズ(行×列)、一画面に表示可能な
文字数、全体で表示可能な最大文字数などである。
If the final output device can receive the fixed phrase code with the prefix, it is transmitted to the output device with the prefixed code. When the prefix is not recognized and only the 2-byte character is recognized, the fixed phrase is also converted into the 2-byte code and output. Of course, the attributes of the output devices also have the attributes peculiar to the respective output devices, so that the display most suitable for the output device must be performed. The attributes of the output device include the screen size (row x column) of the device to which the text is output, the number of characters that can be displayed on one screen, the maximum number of characters that can be displayed as a whole, and the like.

【0050】出力機器の属性については、図31のよう
な属性がある。
The attributes of the output device are as shown in FIG.

【0051】文字数とは、バイト数と同じである。日本
語の漢字を表示する場合常に2バイト(2文字)の領域
が必要となる。画面サイズ(行)とは、出力機器の持つ
画面の縦方向の解像度文字数(ここでいう文字とは、A
SCII 1バイト文字をいう)で表現したもの。つま
り、上記例では、縦方向に同時に表示できる文字数は2
文字ということになる。また、画面サイズ(列)とは、
出力機器の持つ画面の横方向の解像度を文字数で表現し
たもの。属性値が1つの数字しかない場合は、全ての行
が画面サイズ(列)で示されるだけの文字数だけ表示さ
れることになる。もし、1以上の数字が属性値として与
えられている場合には、各行の持っている画面サイズ
(列)を表す。1画面に表示可能な文字数は、通常は、
画面サイズ(行)×画面サイズ(列)である。全体最大
文字数は、通信文として、一回に出力機器に送ることの
できる最大文字数であり、通常は、以下の関係が成り立
っている。
The number of characters is the same as the number of bytes. When displaying Japanese Kanji, the area of 2 bytes (2 characters) is always required. The screen size (row) is the number of resolution characters in the vertical direction of the screen of the output device (the character here is A
SCII 1-byte character). That is, in the above example, the number of characters that can be displayed simultaneously in the vertical direction is 2
It will be a character. What is the screen size (column)?
The horizontal resolution of the screen of the output device expressed in characters. When the attribute value has only one number, all lines are displayed by the number of characters indicated by the screen size (column). If a number of 1 or more is given as an attribute value, it represents the screen size (column) of each row. The number of characters that can be displayed on one screen is usually
Screen size (row) x screen size (column). The total maximum number of characters is the maximum number of characters that can be sent to the output device at one time as a communication message, and the following relationships are usually established.

【0052】 (全体最大文字数)≧(1画表示可文字数) これらの出力機器属性は、各出力機器のシリーズごとに
決定されている場合や、通信相手によって決定されるこ
とがある。また、通信相手が複数の出力機器を持ち、出
力機器の属性が不定である場合もある。その場合、サー
バー(出力機器が直接サーバーになる場合もあるが)に
対して、出力機器の属性を取得する。サーバー名は、出
力機器属性を蓄積しているサーバー名(URLでもよ
い)を記述する。プロトコルは、該サーバーから出力機
器属性を取得するためのクライアント/サーバー間の通
信プロトコルを意味する。例えば、HTTP,FTP,
TELNETなどがある。属性を上記通信プロトコルで
取得する場合、どのような記述形式で属性が記述されて
いるかという構造について記述したのが、記述言語の部
分である。HTMLやXMLなどが考えられる。例え
ば、上記の例がXMLで記述されている場合、図32の
ように属性情報が記述される。“<”,”>”は、タグ
の開始と終了を示す記号。開始、終了のタグの中にタグ
名(ここでは、属性名が記述される。“</”,”>”
は、該タグ名で示されるパラメータの終了を示す。上記
タグの間に各属性の属性値がパラメータとして記述され
る。
(Total maximum number of characters) ≧ (number of characters that can be displayed on one screen) These output device attributes may be determined for each series of output devices or may be determined by a communication partner. In addition, the communication partner may have a plurality of output devices, and the attributes of the output devices may be undefined. In that case, the attribute of the output device is obtained with respect to the server (the output device may be the server directly). The server name describes the server name (may be a URL) that stores the output device attributes. The protocol means a client / server communication protocol for acquiring the output device attribute from the server. For example, HTTP, FTP,
There is TELNET etc. The description language part describes the structure of the description format in which the attribute is described when the attribute is acquired by the communication protocol. HTML and XML are possible. For example, when the above example is described in XML, the attribute information is described as shown in FIG. "<", ">" Are symbols that indicate the start and end of the tag. The tag name (here, the attribute name is described in the start and end tags. “<//”, “>”)
Indicates the end of the parameter indicated by the tag name. The attribute value of each attribute is described as a parameter between the above tags.

【0053】上記のように、各ポイントの項目を算出
し、最もポイントが高い候補を最尤候補として、アクテ
ィブメッセージAとして出力する。
As described above, the item of each point is calculated, and the candidate with the highest point is output as the active message A as the maximum likelihood candidate.

【0054】出力機器の送信プロトコルに応じて、適切
なプロトコルでアクティブメッセージ抽出部5の出力し
た候補を送る。例えば、プロトコルがHTTPであれ
ば、HTTPで出力機器と情報のやり取りを行い、テキ
スト変換候補を出力する。
The candidates output by the active message extraction unit 5 are sent by an appropriate protocol according to the transmission protocol of the output device. For example, if the protocol is HTTP, information is exchanged with the output device by HTTP, and the text conversion candidate is output.

【0055】例えば、基本メッセージMの例2では、
“レストラン”+“食事”+“NOW”X/”12:0
0”+“帰る”+“?”X/”後#33”+/の場合、
HTTPであると、出力機器と図33のように通信を行
う。
For example, in Example 2 of the basic message M,
"Restaurant" + "Meals" + "NOW" X / "12: 0
0 ”+“ return ”+“? ” In case of # 33 ”+ /” after “X /”,
If it is HTTP, it communicates with the output device as shown in FIG.

【0056】←出力機器は、出力機器から装置側への情
報転送。
← The output device transfers information from the output device to the device side.

【0057】→出力機器は、装置側から出力機器への情
報転送。
→ The output device transfers information from the device side to the output device.

【0058】HTML3.0では、改行は“<BR>”
で表される。
In HTML3.0, the line feed is "<BR>"
It is represented by.

【0059】出力機器の画面上では、上記HTMLは結
果として、図34のように表示される。
As a result, the HTML is displayed as shown in FIG. 34 on the screen of the output device.

【0060】図35を参照すると、本発明の他の実施形
態のアクティブメッセージ生成装置はキーボード等の入
力装置11と、CRTディスプレイ等の出力装置12
と、アクティブメッセージ生成プログラムを記録した、
FD,CD−ROM,半導体メモリ等の記録媒体13
と、記録媒体13からアクティブメッセージ生成プログ
ラムを読み込み、実行するデータ処理装置14で構成さ
れている。
Referring to FIG. 35, an active message generating device according to another embodiment of the present invention is an input device 11 such as a keyboard and an output device 12 such as a CRT display.
And recorded the active message generator,
Recording medium 13 such as FD, CD-ROM, semiconductor memory
And a data processing device 14 for reading and executing the active message generation program from the recording medium 13.

【0061】ここで、記録媒体13に記録されたアクテ
ィブメッセージ生成プログラムは、図36に示すように
入力装置11から基本メッセージMを入力する基本メッ
セージ処理21と、入力された基本メッセージを自然言
語解析する基本メッセージ解析処理22と、自然言語解
析された基本メッセージを定型メッセージと比較し、意
味的に類似しているかどうかを示す、または意味的に類
似している度合いである比較結果を出力するメッセージ
処理23と、前記比較結果に基づいて、基本メッセージ
Mの中で定型メッセージと類似している基本メッセージ
を定型メッセージに変換するメッセージ定型化処理24
と、基本メッセージMの中で、メッセージを受け取る受
信者にとって意味を持つアクティブな内容のみを抽出す
るアクティブメッセージ抽出処理25と、変換された定
型メッセージの中でアクティブな内容に相当するアクテ
ィブメッセージAだけを出力装置12に出力するアクテ
ィブメッセージ出力処理26からなり、図1の各部1〜
6が行なう処理と同じ処理を行なう。
Here, the active message generation program recorded in the recording medium 13 is, as shown in FIG. 36, the basic message processing 21 for inputting the basic message M from the input device 11 and the natural language analysis of the input basic message. A message that compares the basic message analyzed by the basic message analysis processing 22 with the standard message with the standard message, and indicates whether or not they are semantically similar, or outputs a comparison result that is the degree of similarity. A process 23 and a message stylization process 24 for converting a basic message similar to the standard message in the basic message M to a standard message based on the comparison result.
In the basic message M, only the active message extraction process 25 for extracting only active contents that have meaning to the recipient who receives the message, and only the active message A corresponding to the active contents in the converted standard message. Of the active message output process 26 for outputting the
The same process as that of 6 is performed.

【0062】[0062]

【発明の効果】以上説明したように、本発明によれば、
電子メールやTELEXなどのメッセージ文に対して、
メッセージ内容を析し、定型的な表現は、定型表現に変
換し、また、メッセージの中でアクティブなメッセージ
のみを抽出することにより、メッセージ内容をメッセー
ジ受信者にとって、冗長性が少なく、かつ最も情報量が
多い形で適切に表示することができる。
As described above, according to the present invention,
For message texts such as e-mail and TELEX,
By analyzing the message contents, converting the canonical expressions into canonical expressions, and extracting only the active messages in the message, the message contents are less redundant to the message recipient and the most informative. It can be properly displayed in a large amount.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の一実施形態のアクティブメッセージ生
成装置の構成図である。
FIG. 1 is a configuration diagram of an active message generation device according to an embodiment of the present invention.

【図2】基本メッセージの例を示す図である。FIG. 2 is a diagram showing an example of a basic message.

【図3】電子メールにおける書誌事項を示す図である。FIG. 3 is a diagram showing bibliographic items in an electronic mail.

【図4】電子メールにおける送り先の名称の規則を示す
図である。
FIG. 4 is a diagram showing a rule of a destination name in an electronic mail.

【図5】基本メッセージMの例を形態素解析した結果を
示す図である。
5 is a diagram showing a result of morphological analysis of an example of a basic message M. FIG.

【図6】抽出された形態素候補を示す図である。FIG. 6 is a diagram showing extracted morpheme candidates.

【図7】“テスト”の場合の形態素候補を示す図であ
る。
FIG. 7 is a diagram showing morpheme candidates in the case of “test”.

【図8】リンクコストの例を示す図である。FIG. 8 is a diagram showing an example of link costs.

【図9】各単語ごとに抽出されらノードコストを示す図
である。
FIG. 9 is a diagram showing a node cost extracted for each word.

【図10】“テスト”の部分だけのコストを示す図であ
る。
FIG. 10 is a diagram showing costs of only a “test” portion.

【図11】図10の形態素の組み合わせをコストの低い
順に並べた図である。
11 is a diagram in which the combinations of morphemes in FIG. 10 are arranged in ascending order of cost.

【図12】基本メッセージMの例の係り受け解析結果を
示す図である。
12 is a diagram showing a dependency analysis result of an example of a basic message M. FIG.

【図13】基本メッセージMの例2を示す図である。FIG. 13 is a diagram showing a second example of a basic message M.

【図14】基本メッセージMの例2の係り受け解析結果
を示す図である。
14 is a diagram showing the dependency analysis result of Example 2 of the basic message M. FIG.

【図15】メッセージ交換サービスの場合の定型メッセ
ージ文を示す図である。
FIG. 15 is a diagram showing a fixed message text in the case of a message exchange service.

【図16】メッセージ交換サービスの場合の記号の意味
を示す図である。
FIG. 16 is a diagram showing the meaning of symbols in the case of a message exchange service.

【図17】(3−1),(3−2),(3−3)の基本
メッセージ文の意味素ネットワークを示す図である。
FIG. 17 is a diagram showing a semantic network of basic message sentences of (3-1), (3-2), and (3-3).

【図18】(4−1),(4−2)の基本メッセージ文
の意味素ネットワークを示す図である。
FIG. 18 is a diagram showing a semantic element network of basic message sentences of (4-1) and (4-2).

【図19】(2−3),(2−4)の基本メッセージ文
の意味素ネットワークを示す図である。
19 is a diagram showing a semantic network of basic message sentences of (2-3) and (2-4). FIG.

【図20】基本メッセージ文(2−4)と(3−3)の
意味素ネットワークの充足度が最も高いことを示す図で
ある。
FIG. 20 is a diagram showing that the degree of sufficiency of the semantic network of the basic message sentences (2-4) and (3-3) is the highest.

【図21】メッセージ比較部3から送られる情報を示す
図である。
FIG. 21 is a diagram showing information sent from the message comparison unit 3.

【図22】基本メッセージ(2−4)の定型化メッセー
ジ例を示す図である。
FIG. 22 is a diagram showing an example of a stylized message of a basic message (2-4).

【図23】基本メッセージ文Mの例2を短文単位に分割
した図である。
FIG. 23 is a diagram in which Example 2 of the basic message sentence M is divided into short sentence units.

【図24】基本メッセージMから抽出された文を示す図
である。
24 is a diagram showing a sentence extracted from a basic message M. FIG.

【図25】アクティブ解析により取得された意味構造を
示す図である。
FIG. 25 is a diagram showing a semantic structure acquired by active analysis.

【図26】メッセージ定型化部4から出力されるメッセ
ージを示す図である。
FIG. 26 is a diagram showing a message output from the message stylization unit 4.

【図27】意味表示が抽出された基本メッセージMの例
2を示す図である。
FIG. 27 is a diagram showing a second example of the basic message M from which the meaning display is extracted.

【図28】基本メッセージMの例2から意味表示を抽出
した結果を示す図である。
28 is a diagram showing a result of extracting a meaning display from Example 2 of the basic message M. FIG.

【図29】図2の例を得点づけした結果を示す図であ
る。
FIG. 29 is a diagram showing a result of scoring the example of FIG. 2.

【図30】ポイントを計算する項目の例を示す図であ
る。
FIG. 30 is a diagram showing an example of items for calculating points.

【図31】出力機器の属性を示す図である。FIG. 31 is a diagram showing attributes of an output device.

【図32】属性がXMLで記述される場合の記述情報を
示す図である。
FIG. 32 is a diagram showing description information when an attribute is described in XML.

【図33】出力機器と装置間の通信を示す図である。FIG. 33 is a diagram showing communication between an output device and an apparatus.

【図34】出力機器の画面上の表示例を示す図である。FIG. 34 is a diagram showing a display example on the screen of the output device.

【図35】本発明の他の実施形態のアクティブメッセー
ジ生成装置の構成図である。
FIG. 35 is a configuration diagram of an active message generation device according to another embodiment of the present invention.

【図36】図34中の記録媒体13に記録されたアクテ
ィブメッセージ生成プログラムの構成図である。
36 is a configuration diagram of an active message generation program recorded in the recording medium 13 in FIG. 34.

【符号の説明】[Explanation of symbols]

1 基本メッセージ入力部 2 基本メッセージ解析部 3 メッセージ比較部 4 メッセージ定型化部 5 アクティブメッセージ抽出部 6 アクティビメッセージ出力部 11 入力装置 12 出力装置 13 記録媒体 14 データ処理装置 21 基本メッセージ入力処理 22 基本メッセージ解析処理 23 メッセージ比較処理 24 メッセージ定型化処理 25 アクティブメッセージ抽出処理 26 アクティブメッセージ出力処理 1 Basic message input section 2 Basic message analysis section 3 Message comparison section 4 Message stylization part 5 Active message extractor 6 Activi message output section 11 Input device 12 Output device 13 recording media 14 Data processing device 21 Basic message input processing 22 Basic message analysis processing 23 Message comparison processing 24 Message standardization processing 25 Active message extraction processing 26 Active message output processing

フロントページの続き (72)発明者 田中 一男 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平5−73611(JP,A) 特開 平9−205664(JP,A) 特開 平7−129588(JP,A) 特開 昭63−175965(JP,A) 特開 昭64−17152(JP,A) (58)調査した分野(Int.Cl.7,DB名) G06F 17/21 - 17/28 G06F 13/00 JICSTファイル(JOIS)Front page continuation (72) Inventor Kazuo Tanaka 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Nihon Telegraph and Telephone Corporation (56) Reference JP-A-5-73611 (JP, A) JP-A-9 -205664 (JP, A) JP 7-129588 (JP, A) JP 63-175965 (JP, A) JP 64-17152 (JP, A) (58) Fields investigated (Int.Cl) . 7 , DB name) G06F 17/21-17/28 G06F 13/00 JISST file (JOIS)

Claims (7)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 メッセージの中でメッセージを受け取る
受信者にとって意味をもつアクティブなメッセージのみ
を生成する装置における処理であって、 前記装置には、意味素と意味素の役割からなる意味素ネ
ットワークで構成された複数の定型メッセージが蓄積さ
れており、 基本メッセージを入力する段階と、前記 入力された基本メッセージを形態素解析する段階
と、形態素解析結果から係り受け解析を行い、前記基本メッ
セージを意味素と意味素の役割からなる意味素ネットワ
ークで構成する段階と、 前記基本メッセージの意味素ネットワークが定型メッセ
ージの意味素ネットワークを充足しているとき、前記基
本メッセージが定型メッセージに一致すると判定し、一
致する場合、意味素ネットワークの一致の度合いを求
め、最も尤度の高い定型メッセージを出力する段階と、 前記出力結果に基づいて、前記基本メッセージの中で前
記定型メッセージと類似している部分を定型メッセージ
に変換する段階と、 前記基本メッセージの中で、メッセージを受け取る受信
者にとって意味を持つアクティブな内容のみを抽出する
段階と、 前記変換された基本メッセージの中で、前記アクティブ
な内容に相当するアクティブメッセージだけを出力する
段階とを有するアクティブメッセージ生成方法。
1. Receiving a message within a message
Only active messages that are meaningful to the recipient
Which is a process in an apparatus for generating a
A number of standard messages composed of
It is and performs the steps of inputting a basic message, a step of morphological analysis the input base message, the dependency analysis of the morphological analysis result, the basic message
A sage is a semantic network consisting of semantics and roles of semantics.
And the semantic network of the basic message is a standard message.
When satisfying the semantic network of
It is judged that this message matches the standard message, and
If there is a match, the degree of coincidence of the semantic network is calculated.
Because, and outputting the highest likelihood fixed message, on the basis of the output result, and converting the fixed message parts that are similar to the fixed message in the base message, the basic message In which only active content that is meaningful to the recipient receiving the message is extracted, and in the converted basic message, only active messages corresponding to the active content are output. Message generation method.
【請求項2】 基本メッセージを入力する基本メッセー
ジ入力手段と、 前記入力された基本メッセージの全ての文字に対して形
態素解析用辞書を用いて形態素候補を抽出し、全ての形
態素候補が抽出された後、各形態の使用される度合いを
示す各形態素のノードコストおよび各形態素候補間の接
続の可能性を示す尺度であるリンクコストを求め、これ
ら形態素候補の組合せに対するノードコストおよびリン
クコストの総和の低い順に並べ、コストの最も少ない候
補を形態素解析結果として出力し、該形態素解析結果か
ら係り受け解析を行い、前記基本メッセージを意味素と
意味素の役割からなる意味素ネットワークで構成する
本メッセージ解析手段と、定型メッセージを意味素ネットワークで構成し、複数の
定型メッセージの意味素ネットワークを蓄積する定型メ
ッセージ蓄積手段と、 前記基本メッセージの意味素ネットワークが定型メッセ
ージの意味素ネットワークを充足しているとき、前記基
本メッセージが定型メッセージに一致すると判定し、一
致する場合、意味素ネットワークの一致の度合いを求
め、最も尤度の高い定型メッセージを 出力するメッセー
ジ比較手段と、 前記メッセージ比較手段の結果に基づいて、前記基本メ
ッセージの中で前記定型メッセージと類似している部分
を定型メッセージに変換するメッセージ定型化手段と、 前記基本メッセージの中で、メッセージを受け取る受信
者にとって意味を持つアクティブな内容のみを抽出する
アクティブメッセージ抽出手段と、 前記変換された基本メッセージの中で前記アクティブな
内容に相当するアクティブメッセージだけを出力するア
クティブメッセージ出力手段とを有するアクティブメッ
セージ生成装置。
2. A basic message input means for inputting a basic message, and a form for all characters of the input basic message.
Morphological candidates are extracted using the dictionary for morphological analysis,
After the candidate elements are extracted, the degree of use of each form
Node cost of each morpheme shown and connection between each morpheme candidate
Find the link cost, which is a measure of continuity
Node cost and phosphorus for combinations of morpheme candidates
In order of lowest total cost, the lowest cost
Outputs the complement as a morphological analysis result,
Dependency analysis is performed, and the basic message is regarded as a semantic element.
A basic message analysis means composed of a semantic network consisting of the roles of semantics and a fixed message composed of a semantic network,
A standard message that stores a semantic network of standard messages.
The message storage means and the semantic network of the basic message are standard messages.
When satisfying the semantic network of
It is judged that this message matches the standard message, and
If there is a match, the degree of coincidence of the semantic network is calculated.
Because the message comparison means for outputting a highest likelihood fixed message, based on a result of the message comparison means, the fixed message similar to fixed message part <br/> are among the basic message Message formalizing means for converting, active message extracting means for extracting only active content that has meaning to a recipient who receives the message in the basic message, and active content in the converted basic message And an active message output means for outputting only an active message corresponding to the above.
【請求項3】 前記メッセージ定型化手段は、不一致意
味素の定型メッセージ部をコード化して出力する、請求
記載の装置。
Wherein the message stylized unit outputs encoding the regular message portion mismatch sense element, according to claim 2, wherein.
【請求項4】 前記アクティブメッセージ抽出手段は、
前記基本メッセージ文を、1つの文の中に1つのアクテ
ッィブなメッセージがある文の単位である短文単位に分
割し、各短文を自然言語解析し、短文単位の形態素解析
結果を用いてアクティブな文であるかどうかを判定し、
アクティブな文の場合、その意味構造を取得する、請求
記載の装置。
4. The active message extracting means,
The basic message sentence is divided into short sentence units, which are units of a sentence in which one active message is included in one sentence, each short sentence is subjected to natural language analysis, and an active sentence is obtained using a morphological analysis result of each short sentence unit. To determine if
The apparatus according to claim 2 , wherein in the case of an active sentence, its semantic structure is obtained.
【請求項5】 前記アクティブメッセージ出力手段は、
出力すべき意味を表わすのに適した表記を記述したコー
ド表に基づき最も少ないコードで出力機器にアクティブ
メッセージを出力する、請求項2記載の装置。
5. The active message output means comprises:
3. The apparatus according to claim 2, wherein the active message is output to the output device with the least number of codes based on the code table describing the notation suitable for indicating the meaning to be output.
【請求項6】 前記アクティブメッセージ出力手段は、
出力機器の送信プロトコルに応じて、適切なプロトコル
でテキスト変換候補を出力する、請求項2記載の装置。
6. The active message output means comprises:
The device according to claim 2, wherein the text conversion candidates are output by an appropriate protocol according to the transmission protocol of the output device.
【請求項7】 基本メッセージを入力する処理と、 前記入力された基本メッセージを形態素解析する処理
と、 形態素解析結果から係り受け解析を行い、前記基本メッ
セージを意味素と意味素の役割からなる意味素ネットワ
ークで構成する処理と、 意味素ネットワークで構成された複数の定型メッセージ
を読み込む処理と、 前記基本メッセージの意味素ネットワークが定型メッセ
ージの意味素ネットワークを充足しているとき、前記基
本メッセージが定型メッセージに一致すると判定し、一
致する場合、意味素ネットワークの一致の度合いを求
め、最も尤度の高い定型メッセージを出力する処理と、 前記出力結果に基いて、前記基本メッセージの中で前記
定型メッセージと類似している部分を定型メッセージに
変換する処理と、 前記メッセージの中で、メッセージを受け取る受信者に
とって意味を持つアクティブな内容のみを抽出する処理
と、 前記変換された定型メッセージの中で前記アクティブな
内容に相当するアクティブメッセージだけを出力する処
理とをコンピュータに実行させるためのアクティブメッ
セージ生成プログラムを記録したコンピュータ読取り可
能な記録媒体。
7. A process of inputting a basic message, a process of morphological analysis of the input basic message, and a dependency analysis based on a morphological analysis result, and the basic message having a meaning consisting of a semantic element and a role of a semantic element. The process of configuring a basic network, the process of reading a plurality of standard messages composed of a semantic network, and when the basic message's semantic network satisfies the standard message's semantic network, the basic message is It is determined that the message matches, and if they match, the degree of matching of the semantic network is calculated, and the process of outputting the most likely fixed message, based on the output result, the fixed message in the basic message. The process of converting a part similar to Computer , a process of extracting only active contents having meaning to a recipient who receives the message, and a process of outputting only active messages corresponding to the active contents in the converted standard message. Computer readable recording active message generator for execution by
Capacity recording medium.
JP34013397A 1997-12-10 1997-12-10 Active message generation method and apparatus, and recording medium recording active message generation program Expired - Fee Related JP3379633B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP34013397A JP3379633B2 (en) 1997-12-10 1997-12-10 Active message generation method and apparatus, and recording medium recording active message generation program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP34013397A JP3379633B2 (en) 1997-12-10 1997-12-10 Active message generation method and apparatus, and recording medium recording active message generation program

Publications (2)

Publication Number Publication Date
JPH11175526A JPH11175526A (en) 1999-07-02
JP3379633B2 true JP3379633B2 (en) 2003-02-24

Family

ID=18334048

Family Applications (1)

Application Number Title Priority Date Filing Date
JP34013397A Expired - Fee Related JP3379633B2 (en) 1997-12-10 1997-12-10 Active message generation method and apparatus, and recording medium recording active message generation program

Country Status (1)

Country Link
JP (1) JP3379633B2 (en)

Also Published As

Publication number Publication date
JPH11175526A (en) 1999-07-02

Similar Documents

Publication Publication Date Title
US7493252B1 (en) Method and system to analyze data
JP3921523B2 (en) Text generation method and text generation apparatus
US20100114562A1 (en) Document processor and associated method
US20050076037A1 (en) Method and apparatus for computerized extracting of scheduling information from a natural language e-mail
JP5540335B2 (en) Natural language sentence generation device and computer program
JP2007287134A (en) Information extraction apparatus and information extraction method
JP2010181993A (en) Evaluation analysis server, method, and program for evaluating text file containing pictorial symbol
CN111966796B (en) Question and answer pair extraction method, device and equipment and readable storage medium
CN109635094B (en) Method and apparatus for generating answers
JP4625535B1 (en) Information extraction system and information extraction program
WO2002021324A1 (en) Method and apparatus for summarizing multiple documents using a subsumption model
CN115186654B (en) Method for generating document abstract
JP7381052B2 (en) Inquiry support device, inquiry support method, program and recording medium
US20180341646A1 (en) Translated-clause generating method, translated-clause generating apparatus, and recording medium
JP2008203984A (en) Character string conversion apparatus and character string conversion method
US20040205670A1 (en) Document information processing apparatus
KR102280028B1 (en) Method for managing contents based on chatbot using big-data and artificial intelligence and apparatus for the same
CN113342179A (en) Processing method, device, electronic device and storage medium for inputting text
JP3379633B2 (en) Active message generation method and apparatus, and recording medium recording active message generation program
WO2001055901A1 (en) Machine translation system, translation server thereof, and client thereof
JP4088171B2 (en) Text analysis apparatus, method, program, and recording medium recording the program
JP5436868B2 (en) Correct answer determination apparatus, correct answer determination system, correct answer determination method, and correct answer determination program
JP5337575B2 (en) Candidate word extraction device, candidate word extraction method, and candidate word extraction program
Chebanyuk Multilingual Question-Driven Approach and Software System to Obtaining Information From Texts.
Narayan et al. Pre-Neural Approaches

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071213

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081213

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091213

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101213

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101213

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111213

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111213

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121213

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121213

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131213

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees